Sitemap.xml — файл в формате XML, содержащий список URL всех важных страниц сайта. Помогает поисковикам быстрее находить и индексировать контент, особенно новые и редко ссылаемые страницы.

Как работает

Файл содержит URL страниц с метаданными: дата последнего изменения (lastmod), частота обновления (changefreq), приоритет (priority). Google и Яндекс читают sitemap и добавляют URL в очередь на сканирование. Для больших сайтов используется sitemapindex — файл, ссылающийся на несколько sub-sitemap.

Где используется

  • Ускорение индексации новых страниц
  • Указание актуальной даты изменения контента
  • Разделение по типам контента: страницы, статьи, изображения, видео
  • Отправка через Google Search Console и Яндекс Вебмастер

Пример структуры

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://site.ru/page/</loc>
    <lastmod>2024-01-15</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Частые ошибки

  • Добавлять страницы с тегом noindex — противоречие сигналов
  • Не обновлять lastmod после изменений — Google перестаёт доверять дате
  • Включать страницы с ошибками 404 и 301-редиректами
  • Не указывать путь к sitemap в robots.txt
Обязателен ли Sitemap.xml?

Технически нет, но он значительно ускоряет индексацию. Особенно важен для новых сайтов, сайтов с большим количеством страниц или редко обновляемым контентом.