Como funciona o algoritmo do Google

Por ,
em

Algoritmo do GoogleAgora que já compreendemos a filosofia por trás do Google, vamos entender de uma maneira geral como é feita uma pesquisa no buscador mais famoso do mundo (ou em qualquer buscador.) O primeiro ponto para que se possa fazer a busca é ter a base de dados com nada menos que boa parte do conteúdo na Internet. Usamos o verbo “indexar” para se referir ao que vai ser armazenado nessa enorme base de dados. Ou seja, é preciso haver uma indexação de todas as páginas.

Os buscadores anteriores ao Google não indexavam todos os sites da web. Eles trabalhavam como o Dmoz.org trabalha até hoje: ao se fazer uma pesquisa nele, era consultada uma base dados com informações cadastradas manualmente ou enviadas pelos proprietários de web sites.

Embora seja possível se cadastrar no Google, na maioria das vezes não é preciso realizar nenhum tipo de submissão ao buscador pois ele “descobre” sua página ao fazer a varredura da web com seu “crawler”.

Googlebot, o web cralwer

Um crawler é um software de computador que salva em sua base de dados todas as páginas que encontrar na web, exceto aquelas que bloquearem seu acesso ou que por algum comando interno seja orientado a não indexar. Os crawler podem ser usados para diversos fins, desde backup de um site, busca de informações ou para armazenamento de todos os sites para consulta posterior e publica através de mecanismos de busca como Bing ou Google.

Googlebot é o crawler do Google, grande responsável por todas as páginas estarem indexadas, e também pela frequência de atualização das páginas no Google.  O que, basicamente, um crawler faz é acessar uma lista de milhões de links já disponíveis, atualizar a informação e seguir todos os novos links disponíveis nas páginas e novas páginas, para garantir que pesquise em todas as páginas da web.

O Googlebot irá determinar a frequência com que visita uma página segundo uma série de fatores, dentre eles a importância daquela página (sites muito importantes podem ser acessados a cada minuto, já outros sites podem ficar semanas sem visita do crawler) e mesmo frequência de atualização. O objetivo do Googlebot é ter o número máximo de páginas o mais atualizadas quanto possível, mas como há um custo para cada varredura o algoritmo do Google usa uma fórmula para equacionar qualidade da informaçãoo e custos para a empresa.

Tratamento das informações

Após indexar tantas páginas, o Google precisa tratar as informações e organizá-las para que ao ser realizada uma consulta se consiga da maneira mais rápida possível (em menos de um segundo) fazer uma varredura em toda a base de dados para trazer a informação desejada.

Para isso, as informações ficam segmentadas por uma série de critérios como palavra-chave, assunto, país, data, idioma, buscando criar uma abstração das informações. Trabalha-se também com um cache poderoso para evitar a consulta à base de dados tanto quanto possível, mas isso deve ser feito de uma maneira abstrata uma vez que boa parte das consultas é única.

Não vamos entrar nesse assunto, até porque não é especificamente nossa área de conhecimento, mas basta mantermos em mente que o Google lida com rotas de informação e por isso consegue realizar tantas consultas e tão rapidamente.

As rotas de pesquisa são muito importantes para economizar servidores. Imagine que se pesquise por “história do Brasil”: por um filtro pré-feito (em “cache”), provavelmente há as páginas que contêm o termo “história”, “do” e “brasil”. Dessa lista de sites, o Google realizará uma nova pesquisa, muito mais simplificada.

Porém, não menos simples. Com as rotas de pesquisa, o algoritmo do Google já saberá em quais sites não pesquisar mas é preciso uma fórmula para ordernar os resultados, ou seja, qual o critério para um site estar bem ou mal posicionado.

Antes, porém, de falarmos de ordenação de resultados vamos entender como é a página de resultados e o que você pode encontrar nela.

Conhecendo as SERP

Conhecendo as SERP

Embora o Google não declare os seus critérios de posicionar um site, nós podemos deduzi-los e para tanto começaremos da maneira mais simples para chegar ao que é mais complexo.

Na busca que utilizamos como exemplo “história do brasil” (não há diferença entre minúscula e maiúscula para o Google), vemos que a SERP (search engine result page, ou página de resultados de mecanismo de busca em tradução livre) traz 10 resultados e para cada resultado há um “snippet”, que é um resumo daquela página e conta com título, link e descrição como podemos ver abaixo.  SERP e snippet são termos que usaremos bastante ao longo de todo o nosso curso, então é fundamental estar familizarizado. Veja um dos snippets de nossa busca:

Exemplo de snippet

Em alguns casos, há itens especiais nos snippets, como o que chamamos de “site links” e consta na imagem acima. Esses sitelinks não aparecem em todos os snippets mas somente em alguns que o Google considera relevantes. Não há como solicitar ao Google que adicione sitelinks, mas há maneiras de “induzi-lo” a adicionar os site links.

Os snippets são os mais variados possíveis e o Google vem investindo bastante na diversificação de snippets, como medida para manter a atenção de seus usuários e até mesmo retê-los por mais tempo em suas páginas. Os snippets irão variar de acordo com uma série de fatores, mas o principal são as buscas verticais que vêm agregar valor à “busca horizontal”, que é a busca geral do Google, como vimos na SERP acima.

Tipos de pesquisa: horizontal e vertical

Você deve ter reparado que o Google não possui um buscador apenas. O Google é formado de diversos Googles: Google Imagens, Google Places (para endereços), Google Videos, Google Blogs, Google News, etc.

Chamamos de buscas verticais, os mecanismos de busca com propósitos específicos. O Apontador é um grande exemplo de buscador vertical, uma vez que nele encontraremos informações sobre endereços e lugares onde visitar (trata-se de uma busca “vertical”, “profunda”  por endereços). O IconFinder.com realiza uma busca vertical por ícones. O Google Images é um buscador virtual de imagens. O Youtube tem um buscador vertical de vídeos, e assim por diante. O Flickr tem um buscador vertical de fotografias. Todas os buscadores que não tenham propósito geral mas sim específico será considerado vertical e no Google costuma ter snippets específicos.

As buscas verticais, entretanto, se misturam aos resultados do Google. Ao realizar uma busca por “brasil”, aparecem buscas verticais de mapas e de imagens.

Tipos de pesquisa

Para fazer SEO, é preciso estar muito bem familizarizado com a SERP do Google e, principalmente, com o funcionamento do algoritmo para que como consultor SEO você seja capaz de desenvolver estratégias por conta própria e exclusivas. Nós não entraremos em todos os detalhes de páginas de busca, pois são realmente muitas, mas incentivamos você a pesquisar em seu tempo livre e encontrar todas as possibilidades de SERP.

Como é formado um Snippet básico

Snippet básico

O snippet é muito importante em SEO, porque é o que determinará o clique e garantirá o acesso à sua página. O snippet é determinado automaticamente pelo Google, mas segue algumas regrinhas simples de entender:

Título da página
www.enderecodosite.com.br/pagina-em-questao.html
Pequena descrição da página em questão, onde se faz negrito do termo de pesquisa, para chamar a sua atenção gerar confiança.

Agora você talvez se pergunte: de onde vêem esses elementos?

O título da página costuma vir da tag <title>, que fica no <head> (cabeçalho) do HTML. O endereço do site é um dado meio óbvio, que dispensa explicação. Já a pequena descrição pode vir de dois lugares: da meta-tag “description” ou ser um excerto do conteúdo daquela página, isto é, um resumo.

É importante saber que o Google não leva as orientações acima à risca e costuma variar sempre que considera relevante para o usuário. É comum encontrarmos breadcrumbs em vez do endereço do site. Não é raro, principalmente entre páginas antigas de quando ainda se usava “Untitled 1” no <title>, o Google escolher um título mais adequado para a página baseando-se principalmente no histórico de busca e nos links externos e internos.

Critérios de pesquisa

A SERP é um bom ponto de partida para entendermos os critérios do Google para posicionamento de um resultado; retomando a imagem acima da SERP, iremos observar que em todos os snippets podemos encontrar o termo “História do Brasil” no título da página, o que nos induz à conclusão de que o título da página é um fator importante de organização dos resultados, o que de fato é. O título da página (<title>) é muito importante porque ele resume do que aquela página está falando, mas se tivermos uma página em branco com a palavra-chave no título não ajudará muita coisa.

É importante ressaltar que qualquer critério que o Google usa nunca é visto isoladamente, mas sempre em conjunto como um todo. Além do mais, a você que talvez esteja pensando em trabalhar consultor em SEO é sempre importante  pensar os “porquês” das questões para que sempre possa resolver os problemas únicos.

Todo este curso será sobre os critérios do Google para posicionar um site. Escolhemos especificamente o <title> que é o principal, para você compreender o funcionamento. Mas agora é hora de voltar à teoria e entender mais um pouco sobre qual tipo de resultado o Google quer trazer.

O resultado mais relevante

O objetivo do Google é trazer o resultado mais relevante para cada uma das buscas. E o que é o resultado mais relevante se não a resposta para aquilo que perguntamos? O resultado mais relevante é sempre aquele que traz mais informações e de uma maneira mais concisa sobre o termo pesquisado.

Sempre que realizamos uma pesquisa, gostamos que o resultado seja uma página somente sobre aquilo que estamos procurando. Por isso, um dos meus maiores segredos de SEO é criar uma página específica para cada palavra-chave que eu desejo que esteja bem posicionada.

Agora, talvez esteja fazendo mais sentido porque todas as páginas têm “história do Brasil” no título: é porque o resultado deve corresponder à busca. Mas ainda ficamos com uma dúvida: só na primeira página do Google havia dez resultados, todos os sites com o termo “História do Brasil” no título.

Obviamente, muitos outros fatores serão levados em conta e não há como determinar, sem antes fazer uma análise profunda, por que aqueles e não outros sites estão bem posicionados. Outros fatores muito importantes para o posicionamento são o conteúdo do site e o quão rico ele é em palavras-chave (tanto “história do Brasil” quanto palavras-chave que o Google sabe que são relacionadas), a quantidade de links recebidos, a âncora desses links e ainda a autoridade dos sites e das páginas que fizeram esses links.

Todos esses critérios serão reunidos no algoritmo do Google, que é chamado de PageRank e é o tema de nossa próxima aula que vai ao ar hoje (23/07), às 19h.

A Conversion na mídia
Rede Globo de Televisão SBT Rede Record TV Bandeirantes Portal do UOL Yahoo Notícias Diário do Comércio e Indústria
Voltar ao Topo
fechar

Solicite Orçamento