Análise da AirOps com 548 mil páginas e 15 mil prompts mostra que ranking orgânico ainda é o principal preditor de citação em IA, mas chegar lá não é suficiente
Quase 50% das citações do ChatGPT vêm de páginas que ocupam a primeira posição no Google. A taxa é 3,5 vezes superior à das páginas fora do top 20 da busca orgânica.
O dado, extraído de uma análise da AirOps com 548.534 páginas recuperadas em 15.000 prompts, reposiciona o debate sobre SEO e IA: não se trata de abandonar o ranqueamento orgânico para “otimizar para ChatGPT”. Trata-se de entender que o Google continua sendo a principal porta de entrada para a visibilidade em IA — e que estar no topo da busca é condição necessária, mas não suficiente.
Porque o mesmo estudo revela que 85% de tudo que o ChatGPT descobre durante o processo de pesquisa nunca chega à resposta final entregue ao usuário.
Ranquear no Google é o primeiro filtro (e o mais importante)
A correlação entre posição no Google e citação no ChatGPT não é coincidência. O modelo usa o índice do Google como uma das principais fontes de descoberta de conteúdo. Páginas bem posicionadas na busca orgânica têm maior probabilidade de entrar no pool de recuperação do ChatGPT simplesmente porque o Google já as sinalizou como relevantes e confiáveis.
Isso significa que a base do SEO tradicional — autoridade de domínio, backlinks, relevância temática, qualidade técnica — continua sendo o alicerce da visibilidade em IA. Os dados confirmam: quem não aparece no topo do Google dificilmente aparece no ChatGPT.
Mas chegar ao topo não garante a citação
A descoberta central da pesquisa da AirOps desfaz uma suposição comum. Estar bem ranqueado aumenta muito a chance de ser recuperado pelo ChatGPT, mas recuperação e citação são etapas distintas, com critérios distintos.
O processo funciona em três estágios. No estágio de descoberta, o ChatGPT identifica páginas potencialmente relevantes a partir do índice do Google e de seu próprio processo interno de busca. Estar no topo do Google é a vantagem decisiva aqui.
No estágio de expansão, o comportamento muda. A pesquisa identificou que 89,6% dos prompts disparam duas ou mais buscas adicionais. O ChatGPT não se limita à primeira rodada de resultados — expande a consulta internamente, rodando pesquisas complementares para preencher lacunas, encontrar evidências de suporte e comparar fontes antes de sintetizar a resposta.
No estágio de seleção, de tudo que foi recuperado ao longo dessas múltiplas buscas, apenas cerca de 15% é efetivamente citado. O restante é descartado, porque não era a opção mais útil, mais fácil de extrair ou mais confiável no momento da síntese.
Ranquear bem resolve o estágio 1. Os estágios 2 e 3 exigem outra camada de trabalho.
A expansão cria uma competição que a maioria não enxerga
O fato de 89,6% dos prompts gerarem buscas adicionais tem uma implicação direta para a estratégia de conteúdo: a página de um site compete não apenas com o resultado direto de uma consulta, mas também com os resultados de sub-consultas internas que o próprio ChatGPT formula — e que o produtor de conteúdo provavelmente nem sabe que existem.
Esse mecanismo é funcionalmente parecido com o query fan-out que o Google usa nos AI Overviews. Em ambos os casos, o sistema expande automaticamente o escopo da pesquisa original antes de compor a resposta.
A consequência é clara: um único artigo bem ranqueado respondendo a uma palavra-chave principal tem cada vez menos chances de sobreviver ao estágio de expansão. Sites com cobertura ampla do cluster de sub-tópicos têm mais superfície para ser recuperados nas buscas adicionais que o modelo gera internamente.
Posição no conteúdo e estrutura determinam a extraibilidade
Uma análise de Kevin Indig com 1,2 milhão de respostas de IA e mais de 18.000 citações verificadas mostrou que 44,2% das citações do ChatGPT vêm dos primeiros 30% do conteúdo da página. Se a resposta principal está enterrada depois de uma introdução genérica, o modelo tem muito menos probabilidade de extraí-la.
Os dados estruturais reforçam o padrão:
- 68,7% das páginas citadas seguem hierarquias lógicas de heading
- 87% utilizam um único H1 como âncora principal
- Quase 80% incluem listas para organizar informações-chave
O ChatGPT escaneia a página da forma como um pesquisador experiente lê um documento: buscando o ponto central antes de decidir se vale aprofundar. Conteúdo em prosa contínua, sem divisões claras, é estruturalmente mais difícil de extrair. Quando o modelo tem múltiplas opções disponíveis, prefere as que comunicam a informação de forma mais acessível.
Autoridade resolve o empate na seleção final
Quando o ChatGPT tem múltiplas páginas igualmente úteis e bem estruturadas para citar, os sinais de autoridade funcionam como critério de desempate. Os fatores identificados pela pesquisa incluem backlinks de domínios que já aparecem em resultados de IA, menções de marca distribuídas pela web, consistência de sinais de entidade e capacidade de corroboração factual.
Vale notar que 74% das citações vão para sites com Domain Authority abaixo de 80 — o que indica que autoridade relativa dentro do contexto temático importa mais do que autoridade absoluta do domínio. Sites especializados e bem estruturados têm condições reais de competir com players maiores.
O que separa os 15% citados dos 85% descartados
A síntese dos dados aponta para práticas concretas que diferenciam as páginas que chegam à resposta final das que são recuperadas e silenciosamente descartadas:
Ranquear no Google continua sendo a base. Sem posição orgânica forte, as chances de entrar no pool de recuperação do ChatGPT caem drasticamente. O investimento em SEO tradicional não é alternativo à presença em IA — é seu pré-requisito.
Antecipar a resposta. O núcleo da resposta deve estar no primeiro terço do conteúdo. Blocos de resumo no topo da página aumentam diretamente a probabilidade de citação.
Usar estrutura limpa. H1 único, H2s organizados por subtópicos, hierarquia lógica ao longo do documento. Estrutura não é apenas boa prática de SEO — é o que torna o conteúdo extraível por IA.
Cobrir o cluster de sub-tópicos. Como o ChatGPT expande as consultas internamente, uma única página não é suficiente. Cobertura ampla dos tópicos relacionados aumenta a superfície de aparição nas buscas adicionais que o modelo gera.
Manter o conteúdo atualizado. O ChatGPT pondera recência. Páginas sem atualização recente estão em desvantagem estrutural frente a conteúdos revisados mais recentemente.
A lacuna entre recuperação e citação é onde a maioria das marcas perde visibilidade em IA hoje. Elas ranqueiam bem no Google, entram no processo de pesquisa do ChatGPT — e são descartadas antes que o usuário veja qualquer resposta. A primeira posição no Google é o melhor ponto de partida. O que acontece depois depende de estrutura, profundidade e autoridade.