Google revela método que permite SLM extrair intenção antes da busca

Pesquisa publicada na EMNLP 2025 demonstra que IA com 8 bilhões de parâmetros consegue antecipar necessidades do usuário analisando comportamento na tela, sem exigir digitação de queries tradicionais

Pesquisadores do Google desenvolveram uma técnica que permite modelos de inteligência artificial menores (Small Language Models) compreenderem a intenção do usuário antes mesmo de uma consulta ser digitada. O estudo, publicado no blog oficial do Google Research, apresenta resultados que podem redefinir o funcionamento dos mecanismos de busca.

A metodologia utiliza uma abordagem em duas etapas para analisar interações na tela, como cliques, toques e rolagem. O modelo Gemini 1.5 Flash, com apenas 8 bilhões de parâmetros, alcançou performance equivalente ao Gemini 1.5 Pro, um modelo significativamente maior.

O processamento ocorre diretamente no dispositivo do usuário, sem envio de dados para servidores externos. Essa característica preserva a privacidade enquanto reduz custos computacionais e aumenta a velocidade de resposta.

O que a pesquisa do Google descobriu

O estudo intitulado “Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition” foi apresentado na conferência EMNLP 2025, em Suzhou, na China. Os engenheiros de software Danielle Cohen e Yoni Halpern lideraram a pesquisa, com participação de seis coautores adicionais.

A descoberta central envolve a capacidade de modelos menores entenderem intenções complexas a partir de sequências de interação do usuário. O método analisa comportamentos como navegação entre telas, cliques em elementos específicos e padrões de rolagem para inferir o objetivo final.

Segundo o Google Research, a técnica supera abordagens tradicionais como chain-of-thought prompting e fine-tuning end-to-end. Os testes foram conduzidos com trajetórias de uso em dispositivos Android e navegação web.

Metodologia de extração em duas etapas

A abordagem desenvolvida pelos pesquisadores divide o processo de compreensão em duas fases distintas. Na primeira etapa, o modelo analisa uma janela deslizante de três telas: anterior, atual e próxima.

Para cada interação, o sistema responde três perguntas fundamentais: qual é o contexto relevante da tela, quais ações o usuário executou e qual pode ser a intenção subjacente. As especulações geradas nesta fase são descartadas na etapa seguinte para reduzir alucinações.

A segunda etapa utiliza um modelo fine-tuned que processa apenas os resumos factuais gerados anteriormente. Esse modelo produz uma declaração de intenção em uma única frase, eliminando informações especulativas do resultado final.

Danielle Cohen, Software Engineer do Google, explicou no blog oficial: “Com a decomposição, modelos menores não precisam mais escolher entre precisão e eficiência – eles conseguem ambos”.

Resultados de performance documentados

Os testes compararam o Gemini 1.5 Flash 8B com o Gemini 1.5 Pro em tarefas de extração de intenção. O modelo menor igualou a performance do maior, demonstrando que a decomposição compensa a diferença de capacidade computacional.

Os pesquisadores também testaram o método com o modelo Qwen2-VL-7B, obtendo resultados consistentes. A avaliação utilizou métricas de F1 score baseadas em uma metodologia chamada Bi-Fact, que mede precisão e recall a partir de fatos atômicos extraídos das declarações de intenção.

O método demonstrou redução significativa de alucinações em comparação com abordagens convencionais. A eliminação de especulações antes do output final contribuiu para respostas mais precisas e verificáveis.

Processamento no dispositivo preserva privacidade

Uma das características centrais da técnica é o processamento on-device. Os dados do usuário não precisam ser enviados para servidores externos, permanecendo integralmente no dispositivo durante toda a análise.

Essa arquitetura oferece benefícios de privacidade relevantes para usuários preocupados com o compartilhamento de informações pessoais. O Google pode entender intenções de busca sem acessar dados sensíveis em seus servidores.

Além disso, o processamento local reduz a latência das respostas e diminui custos de infraestrutura de nuvem. Modelos menores executados localmente consomem menos recursos computacionais do que chamadas para modelos grandes hospedados remotamente.

Dados de contexto sobre busca e inteligência artificial

O Google mantém 90,04% do mercado global de busca, segundo dados do StatCounter de janeiro de 2026. A empresa tem investido em recursos baseados em IA, como o AI Mode, para modernizar a experiência de pesquisa.

Dados do BrightEdge indicam que AI Overviews aparecem em 27,55% das buscas em dispositivos móveis nos Estados Unidos. O próprio Google reporta que mais de 1 bilhão de usuários utilizam esse recurso mensalmente.

Pesquisa da Semrush aponta que 58,5% das buscas no Google terminam em zero-clique, com usuários obtendo respostas diretamente na página de resultados. A técnica de extração de intenção antecipada pode ampliar essa tendência ao antecipar necessidades antes mesmo da digitação.

O que o estudo menciona sobre otimização

O paper apresentado na EMNLP 2025 menciona que jornadas de usuário claras e lógicas favorecem a extração de intenção pelos modelos. A referência no texto original destaca “clear, logical user journeys” como fator relevante para o funcionamento da técnica.

Essa observação sugere que sites com navegação intuitiva e arquitetura de informação bem estruturada podem ser mais facilmente compreendidos pelos sistemas de IA. A lógica de uso se torna tão relevante quanto o conteúdo textual para algoritmos que analisam comportamento.

O modelo Gemini utilizado nos testes é a mesma família de IA que alimenta diversos produtos do Google, incluindo AI Overviews e AI Mode. A pesquisa indica direção técnica para futuras implementações desses recursos.

Foto de Escrito por Gabriel Cardozo

Escrito por Gabriel Cardozo

guest

0 Comentários
Inline Feedbacks
View all comments
Foto de Escrito por Gabriel Cardozo

Escrito por Gabriel Cardozo

Compartilhe este conteúdo

Curso de SEO

Gratuito e com certificado. Mais de 13.620 pessoas já participaram.
Preencha o formulário e assista agora!

Estamos processando sua inscrição. Aguarde...

Seus dados de acesso à sua Jornada no curso serão enviados no e-mail cadastrado.
Receba o melhor conteúdo de SEO & Marketing em seu e-mail.
Assine nossa newsletter e fique informado sobre tudo o que acontece no mercado
Receba o melhor conteúdo de SEO & Marketing em seu e-mail.
Assine nossa newsletter e fique informado sobre tudo o que acontece no mercado
Agende uma reunião e conte seus objetivos
Nossos consultores irão mostrar como levar sua estratégia digital ao próximo nível.