O mecanismo de busca do Google é um dos recursos mais utilizados de toda a internet. Apesar disso, pouco se sabe sobre como a ferramenta escolhe quais sites aparecem primeiro na lista. Desde 1998, quando o Google foi criado com a missão de organizar o conhecimento online, esse sempre foi o grande segredo da empresa.
Isso, porém, pode estar prestes a mudar. No final de maio, foram vazadas aproximadamente 2,5 mil páginas de documentos que detalham como opera o buscador. A papelada aponta para a forma como o mecanismo estabelece a ordem de páginas que aparece para o usuário – algo que pode gerar mudanças entre os donos de sites que tentam posicionar melhor suas páginas no ranking do Google. Especialistas apontam que o vazamento pode causar movimentação intensa na indústria especializada em ranqueamento de páginas.
Os dados foram revelados por Rand Fishkin e Mike King, especialistas em SEO, nome dado aos profissionais focados em técnicas para otimizar o ranqueamento de páginas. Segundo eles, as informações estavam no GitHub e teriam sido repassadas pelo leaker Erfan Azimi, que supostamente tinha objetivo de divulgar o que há por trás do algoritmo da empresa.
No dia 29 de maio, o Google confirmou a veracidade das informações ao site The Verge, mas pregou cautela para evitar conclusões definitivas sobre a ferramenta.
“Aconselhamos cuidado ao se fazer suposições imprecisas sobre o Search baseado em informações descontextualizadas, ultrapassadas ou incompletas”, afirmou o porta-voz da empresa, Davis Thompson. “Nós compartilhamos informações extensas sobre como o Search funciona e os tipos de fatores que nossos sistemas pesam, ao mesmo tempo em que trabalhamos para proteger a integridade de nossos resultados da manipulação”, disse.
Como funciona o Google Search
Os documentos sugerem que, ao menos em algum momento, o Google Search contou com cerca de 14 mil indicadores focados em organizar a ordem e o ranking em que aparecem os sites na internet. Estão incluídos nessa fórmula número de cliques, palavras-chave e até mesmo a autoridade da página em relação a certo tema.
No entanto, os papéis revelaram que alguns desses indicadores existem apesar de o Google ter negado anteriormente a sua influência no processo de ranqueamento. É o caso do número de cliques, do tempo gasto por internautas em determinada página e de outros dados coletados dos usuários a partir do Google Chrome – sites visitados a partir do navegador do Google ganham mais pontos, algo que a companhia negava fazer.
Assim, páginas mais populares podem aparecer primeiro na fila de sites, ainda que suas informações não apresentem a mesma qualidade dos sites em posições inferiores no ranking. Isso contradiz o que o Google vinha informando até o momento.
O vazamento mostra também que o buscador pode determinar uma quantidade máxima de sites ou posts que aparecerão após a busca, e pode rebaixar páginas por conter pornografia ou por apresentar altos níveis de insatisfação do usuário. A companhia também mantém um filtro específico para temas sensíveis, como eleições, o que sugere que o teor político de uma página pode influenciar no seu ranqueamento.
O Google possui um histórico com uma cópia de cada versão de todos os sites já indexados para poder compará-las e perceber cada mudança realizada. Por fim, descobriu-se que as páginas indexadas pelo Google são monitoradas e avaliadas quanto ao tempo em que estão no ar, apontando para a importância de sua longevidade.
Com informações de Estadão Conteúdo (Sabrina Brito).
Imagem: Shutterstock