Назад к новостям

案例分享

2026/04/08

Глубокий анализ ограничения Googlebot в 2 МБ: Практическое руководство по технической оптимизации страниц для сайтов внешней торговли

Гари Ильес из Google подробно раскрыл технические детали архитектуры краулера Googlebot и ограничения в 2 МБ. В этой статье с практической точки зрения создания сайтов для внешней торговли анализируется влияние этих технических параметров на индексацию страниц и предлагаются конкретные решения по оптимизации.

Глубокий анализ ограничения Googlebot в 2 МБ: Практическое руководство по технической оптимизации страниц для сайтов внешней торговли

Google впервые раскрывает технические детали архитектуры краулера

Недавно Гари Ильес из Google опубликовал важный технический блог, в котором впервые систематически раскрыл архитектурный дизайн системы краулера Googlebot и технические детали на уровне байтов. Эта информация имеет решающее значение для понимания того, как Google сканирует и индексирует веб-страницы, особенно для технической оптимизации сайтов внешней торговли, где она имеет прямое практическое значение.

Ключевое открытие: Googlebot — всего лишь один из клиентов общей платформы

Ильес раскрыл ранее неизвестную архитектурную деталь: Googlebot является лишь одним из "пользователей" централизованной платформы сканирования внутри Google. Другие продукты, такие как Google Shopping и AdSense, также отправляют запросы на сканирование через ту же платформу, но используют свои собственные имена краулеров.

Каждый клиент может независимо настраивать свою конфигурацию, включая строку пользовательского агента, токены robots.txt и ограничения по байтам. Когда вы видите Googlebot в логах сервера, это краулер Google Search; другие клиенты появляются под своими собственными именами краулеров.

Полная техническая правда об ограничении в 2 МБ

Googlebot имеет верхний предел сканирования для любого URL в 2 МБ (за исключением файлов PDF, где ограничение составляет 64 МБ). Краулеры без указанного ограничения по умолчанию используют лимит в 15 МБ. Вот подробное техническое поведение ограничения в 2 МБ:

Заголовки HTTP-запроса также учитываются в ограничении 2 МБ. Это означает, что для страниц, близких к лимиту, заголовки запроса могут "отнимать" место у фактического контента.

Страницы, превышающие 2 МБ, не отклоняются. Googlebot прекращает сканирование при достижении 2 МБ, а затем отправляет усеченное содержимое в системы индексации Google и службу веб-рендеринга (WRS). Эти системы обрабатывают усеченный файл как полный — весь контент после 2 МБ не будет сканироваться, рендериться или индексироваться.

Внешние ресурсы имеют собственные счетчики байтов. Файлы CSS и JavaScript, на которые есть ссылки в HTML, имеют свои собственные ограничения в 2 МБ и не учитываются в лимите родительской страницы. Однако WRS не сканирует изображения, видео, шрифты и некоторые "специальные файлы".

WRS не сохраняет состояние. Служба веб-рендеринга очищает локальное хранилище и данные сеанса между каждым запросом. Функции JavaScript, зависящие от localStorage или sessionStorage, недоступны при рендеринге Google.

Анализ практического влияния на сайты внешней торговли

Большинству сайтов внешней торговли не о чем беспокоиться

Данные HTTP Archive показывают, что объем HTML подавляющего большинства веб-страниц значительно ниже порога в 2 МБ. Типичный HTML-объем страницы продукта для внешней торговли обычно составляет от 100 КБ до 500 КБ, что оставляет значительный запас до 2 МБ.

Но к этим типам страниц следует относиться с осторожностью

Следующие типы веб-страниц для внешней торговли могут приближаться к ограничению в 2 МБ или превышать его:

  • Страницы больших каталогов товаров — страницы категорий, содержащие десятки или даже сотни карточек товаров
  • Страницы с встроенными изображениями в формате Base64 — изображения, непосредственно закодированные в HTML
  • Страницы с большим количеством встроенного CSS/JavaScript — стили и скрипты не вынесены во внешние файлы
  • Очень большие меню навигации — гигантские структуры навигации, содержащие сотни ссылок
  • Страницы с длинными описаниями товаров — страницы, содержащие множество технических характеристик и встроенных стилей

Скрытая стоимость заголовков HTTP-запроса

Для сайтов внешней торговли, использующих множество файлов cookie, пользовательских заголовков или сложные механизмы аутентификации, заголовки HTTP-запроса могут занимать значительное пространство. Хотя в большинстве случаев это не проблема, для страниц, близких к ограничению в 2 МБ, важен каждый байт.

Практические решения по оптимизации страниц для сайтов внешней торговли

1. Аудит объема страницы

Сначала определите, есть ли у вашей страницы риск:

# Используйте curl для проверки размера HTML страницы
curl -sL -o /dev/null -w '%{size_download}' https://your-site.com/your-page

Если возвращаемое значение близко к 1,5 МБ или превышает его, требуется серьезная оптимизация.

Более системный подход — использовать панель Network в Chrome DevTools, отфильтровать запросы HTML-документов и проверить Transfer Size и Response Size.

2. Приоритетное размещение ключевого контента

Google четко рекомендует: Мета-теги, теги title, элементы link, канонические теги и структурированные данные должны появляться в начале HTML. Это связано с тем, что если страница будет усечена, контент, расположенный ближе к концу, может вообще не проиндексироваться.

Конкретные рекомендации для сайтов внешней торговли:

  • Размещайте ключевые для SEO мета-описания и структурированные данные в <head>
  • Убедитесь, что ключевая информация, такая как название товара, цена, основное описание, появляется в первых 1 МБ исходного кода HTML
  • Размещайте FAQ и длинный контент после основной информации о товаре

3. Вынос CSS и JavaScript во внешние файлы

Это наиболее эффективная стратегия уменьшения объема. Каждый внешний файл CSS и JavaScript имеет свой собственный лимит в 2 МБ:

  • Переносите большие блоки встроенного CSS во внешние таблицы стилей
  • Переносите встроенный JavaScript во внешние файлы скриптов
  • Используйте CSS Sprites или SVG вместо встроенных изображений Base64

Распространенной ошибкой при создании сайтов для внешней торговли является встраивание CSS и JS сторонних инструментов чата, аналитики, переводческих компонентов прямо в HTML, что приводит к раздуванию объема страницы.

4. Оптимизация структуры навигации

Крупные B2B-сайты внешней торговли часто имеют сложную навигацию по категориям товаров, которая может содержать сотни ссылок. Рекомендации по оптимизации:

  • Используйте JavaScript для динамической загрузки подменю — уменьшите количество разметки навигации в исходном HTML
  • Рассмотрите возможность использования упрощенной мобильной навигации — уменьшите дублирование HTML навигации
  • Разумно используйте noindex/nofollow — избегайте включения ссылок на низкоценные страницы в навигации

5. Стратегия разбиения на страницы для страниц каталога товаров

Для страниц категорий, содержащих большое количество товаров:

  • Ограничьте количество товаров на странице — рекомендуется не более 24-36 товаров на страницу
  • Используйте ленивую загрузку — динамически загружайте больше товаров с помощью JavaScript
  • Реализуйте разумную пагинацию — используйте rel=next/prev или правильные канонические теги

6. Оптимизация структурированных данных

Структурированные данные (JSON-LD) являются ключевыми для GEO-оптимизации сайтов внешней торговли, но они также увеличивают объем страницы:

  • Используйте формат JSON-LD, а не Microdata — он более компактный и не влияет на структуру HTML
  • Размечайте только необходимые атрибуты — избегайте добавления избыточных атрибутов Schema
  • Размещайте структурированные данные в конце <head> — убедитесь, что они находятся до возможной точки усечения

Ограничение в 2 МБ может измениться

Ильес в своем блоге особо отметил: "Это ограничение в 2 МБ не высечено в камне и может измениться по мере развития сети и роста размера HTML-страниц." Это важный сигнал — по мере того как веб-страницы становятся все более сложными, Google может в будущем повысить этот порог.

Но до тех пор, пока ограничение не будет повышено, лучшей практикой для создания сайтов внешней торговли остается сохранение страниц лаконичными и приоритетное размещение ключевого контента.

Влияние бессостоятельности WRS на сайты внешней торговли

Если ваш сайт внешней торговли использует следующие технологии, обратите особое внимание:

  • Корзина покупок на основе localStorage — Google не может отобразить состояние корзины
  • Отображение товаров, зависящее от сеанса — каждый визит Google — это новое состояние
  • Инструменты A/B-тестирования — убедитесь, что Google видит версию по умолчанию
  • Локализованный контент — Google не сохраняет состояние выбора региона

Убедитесь, что основная информация о ваших товарах может быть полностью представлена в среде рендеринга без сохранения состояния.

Мнение 01CodeTech

Ограничение Googlebot в 2 МБ не является насущной проблемой для большинства сайтов внешней торговли, но понимание этих технических деталей является основой профессионального создания сайтов и глубокой SEO-оптимизации. В условиях жесткой конкуренции на рынке внешней торговли каждая деталь технического SEO может стать преимуществом, позволяющим опередить конкурентов.

В 01CodeTech при создании сайтов для внешней торговли мы всегда придерживаемся философии "техническая основа определяет потолок оптимизации". Мы помогаем клиентам с самого начала создания сайта строить архитектуру страниц, соответствующую техническим спецификациям Google, чтобы избежать оплаты технического долга в будущем. Если вы хотите убедиться, что ваш сайт для внешней торговли полностью соответствует требованиям архитектуры краулера Google, следите за 01CodeTech для получения профессиональной технической поддержки.


Технический источник: Google Developers Blog (Гари Ильес), Search Off the Record Podcast Episode 105

Начать

Готовы показать миру
вашбренд?

Оставьте контактные данные, и мы предоставим бесплатный диагностический отчёт по выходу на международный рынок в течение 24 часов

Ответим в течение 24 часов