案例分享
2026/04/08
Análise Profunda do Limite de Rastreamento de 2MB do Googlebot: Guia Prático de Otimização Técnica para Páginas de Sites de Comércio Exterior
Gary Illyes, do Google, detalhou a arquitetura do rastreador Googlebot e os detalhes técnicos do limite de 2MB. Este artigo analisa o impacto desses parâmetros técnicos na indexação de páginas, do ponto de vista prático de sites de comércio exterior, e fornece soluções específicas de otimização.

Google Divulga pela Primeira Vez Detalhes Técnicos da Arquitetura do Rastreador
Gary Illyes, do Google, publicou recentemente um importante blog técnico, divulgando de forma sistemática pela primeira vez os detalhes de design da arquitetura do sistema de rastreador Googlebot e informações técnicas em nível de bytes. Essas informações são cruciais para entender como o Google rastreia e indexa páginas da web, especialmente para a otimização técnica de sites de comércio exterior, tendo um significado orientador direto.
Descoberta Chave: Googlebot é Apenas um Cliente de uma Plataforma Compartilhada
Illyes revelou um detalhe arquitetônico previamente desconhecido: O Googlebot é apenas um dos "usuários" de uma plataforma centralizada de rastreamento interna do Google. Outros produtos como Google Shopping e AdSense também enviam solicitações de rastreamento pela mesma plataforma, mas usam nomes de rastreadores diferentes.
Cada cliente pode definir suas próprias configurações de forma independente, incluindo string de agente do usuário, tokens do robots.txt e limite de bytes. Quando você vê Googlebot nos logs do servidor, é o rastreador do Google Search; outros clientes aparecem com seus respectivos nomes de rastreador.
A Verdade Técnica Completa do Limite de 2MB
O limite de rastreamento do Googlebot para qualquer URL é de 2MB (exceto arquivos PDF, cujo limite é 64MB). Rastreadores sem limite especificado usam um limite padrão de 15MB. Aqui está o comportamento técnico detalhado do limite de 2MB:
Os cabeçalhos de solicitação HTTP também contam para o limite de 2MB. Isso significa que, para páginas próximas do limite, os cabeçalhos de solicitação podem "ocupar" o espaço do conteúdo real.
Páginas com mais de 2MB não são rejeitadas. O Googlebot para de rastrear ao atingir 2MB e envia o conteúdo truncado para o sistema de indexação do Google e o serviço de renderização web (WRS). Esses sistemas tratam o arquivo truncado como um arquivo completo — todo o conteúdo após 2MB não será rastreado, renderizado ou indexado.
Recursos externos têm contadores de bytes independentes. Arquivos CSS e JavaScript referenciados no HTML têm limites independentes de 2MB cada, não contando para a cota da página pai. No entanto, o WRS não rastreia imagens, vídeos, fontes e certos "arquivos especiais".
O WRS é sem estado. O serviço de renderização web limpa dados de armazenamento local e de sessão entre cada solicitação. Funcionalidades JavaScript que dependem de localStorage ou sessionStorage não estão disponíveis na renderização do Google.
Análise do Impacto Prático em Sites de Comércio Exterior
A maioria dos sites de comércio exterior não precisa se preocupar
Dados do HTTP Archive mostram que a grande maioria das páginas web tem volume HTML muito abaixo do limite de 2MB. Uma página típica de produto de comércio exterior geralmente tem tamanho HTML entre 100KB e 500KB, com uma margem considerável até 2MB.
Mas esses tipos de páginas precisam de atenção
Os seguintes tipos de páginas de comércio exterior podem se aproximar ou exceder o limite de 2MB:
- Páginas de catálogo de produtos grandes — páginas de categoria com dezenas ou até centenas de cartões de produtos
- Páginas que usam imagens Base64 inline — codificando imagens diretamente no HTML
- Páginas com muito CSS/JavaScript inline — sem externalizar estilos e scripts
- Menus de navegação muito grandes — estruturas de navegação gigantes com centenas de links
- Páginas de descrição de produtos com textos longos — páginas com muitas especificações técnicas e estilos inline
O custo oculto dos cabeçalhos de solicitação HTTP
Para sites de comércio exterior que usam muitos cookies, cabeçalhos personalizados ou mecanismos complexos de autenticação, os cabeçalhos de solicitação HTTP podem ocupar um espaço considerável. Embora na maioria dos casos isso não seja um problema, para páginas próximas do limite de 2MB, cada byte é importante.
Soluções Práticas de Otimização de Páginas para Sites de Comércio Exterior
1. Auditoria de Volume de Página
Primeiro, verifique se sua página tem risco:
# Usar curl para verificar o tamanho do HTML da página
curl -sL -o /dev/null -w '%{size_download}' https://seu-site.com/sua-pagina
Se o valor retornado estiver próximo ou exceder 1,5MB, é necessário otimizar seriamente.
Uma abordagem mais sistemática é usar o painel Network do Chrome DevTools, filtrar solicitações de documentos HTML e verificar Transfer Size e Response Size.
2. Conteúdo Chave na Frente
O Google recomenda explicitamente: Meta tags, tags de título, elementos link, marcações canônicas e dados estruturados devem aparecer em posições anteriores no HTML. Isso porque, se a página for truncada, o conteúdo posterior pode não ser indexado.
Recomendações específicas para sites de comércio exterior:
- Colocar a descrição Meta crucial para SEO e dados estruturados dentro de
<head> - Garantir que informações-chave como nome do produto, preço e descrição principal apareçam dentro do primeiro 1MB do código-fonte HTML
- Colocar FAQ e conteúdo longo após as informações principais do produto
3. Externalizar CSS e JavaScript
Esta é a estratégia mais eficaz para reduzir volume. Cada arquivo CSS e JavaScript externo tem seu próprio limite de bytes de 2MB:
- Mover grandes blocos de CSS inline para folhas de estilo externas
- Mover JavaScript inline para arquivos de script externos
- Usar CSS Sprites ou SVG em vez de imagens Base64 inline
Um erro comum em sites de comércio exterior é incorporar CSS e JS de ferramentas de chat de terceiros, scripts de análise e componentes de tradução inline no HTML, causando inchaço no volume da página.
4. Otimizar Estrutura de Navegação
Grandes sites B2B de comércio exterior frequentemente possuem navegação complexa de categorias de produtos, podendo conter centenas de links. Recomendações de otimização:
- Usar JavaScript para carregar submenus dinamicamente — reduzir marcações de navegação no HTML inicial
- Considerar usar navegação simplificada para dispositivos móveis — reduzir HTML de navegação duplicado
- Usar noindex/nofollow adequadamente — evitar incluir links para páginas de baixo valor na navegação
5. Estratégia de Paginação para Páginas de Catálogo de Produtos
Para páginas de categoria com muitos produtos:
- Limitar o número de produtos por página — recomenda-se não mais que 24-36 produtos por página
- Usar carregamento preguiçoso (lazy loading) — carregar mais produtos dinamicamente via JavaScript
- Implementar paginação adequada — usar rel=next/prev ou marcações canônicas corretas
6. Otimização de Dados Estruturados
Dados estruturados (JSON-LD) são cruciais para otimização GEO de sites de comércio exterior, mas também aumentam o volume da página:
- Usar formato JSON-LD em vez de Microdata — mais compacto e não afeta a estrutura HTML
- Marcar apenas atributos necessários — evitar adicionar atributos Schema redundantes
- Colocar dados estruturados no final de
<head>— garantir que estejam antes de possíveis pontos de truncamento
O Limite de 2MB Pode Mudar
Illyes destacou especificamente no blog: "Este limite de 2MB não é imutável e pode mudar com o desenvolvimento da web e o crescimento do tamanho das páginas HTML." Este é um sinal importante — à medida que as páginas web se tornam mais complexas, o Google pode aumentar esse limite no futuro.
Mas até que o limite seja aumentado, a melhor prática para sites de comércio exterior continua sendo manter as páginas enxutas e o conteúdo-chave na frente.
Impacto da Natureza Sem Estado do WRS em Sites de Comércio Exterior
Se seu site de comércio exterior usa as seguintes tecnologias, preste atenção especial:
- Carrinho de compras baseado em localStorage — o Google não pode renderizar o estado do carrinho
- Exibição de produtos dependente de sessão — cada acesso do Google é um estado totalmente novo
- Ferramentas de teste A/B — garantir que o Google veja a versão padrão
- Conteúdo regionalizado — o Google não retém o estado de seleção de região
Garanta que suas informações principais do produto possam ser apresentadas completamente em um ambiente de renderização sem estado.
Perspectiva da 01CodeTech
O limite de 2MB do Googlebot não é um problema urgente para a maioria dos sites de comércio exterior, mas entender esses detalhes técnicos é a base para construção profissional de sites e otimização profunda de SEO. No competitivo mercado de comércio exterior, cada detalhe do SEO técnico pode se tornar uma vantagem para superar a concorrência.
A 01CodeTech mantém consistentemente a filosofia de "a base técnica determina o limite de otimização" na construção de sites de comércio exterior. Ajudamos os clientes a estabelecer, desde o início, uma arquitetura de página que atenda às especificações técnicas do Google, evitando pagar por dívidas técnicas no futuro. Se você quer garantir que seu site de comércio exterior esteja totalmente adaptado aos requisitos da arquitetura do rastreador do Google, siga a 01CodeTech para obter suporte técnico profissional.
Fonte técnica: Google Developers Blog (Gary Illyes), Search Off the Record Podcast Episódio 105