Sitemap.xml — файл в формате XML, содержащий список URL всех важных страниц сайта. Помогает поисковикам быстрее находить и индексировать контент, особенно новые и редко ссылаемые страницы.
Как работает
Файл содержит URL страниц с метаданными: дата последнего изменения (lastmod), частота обновления (changefreq), приоритет (priority). Google и Яндекс читают sitemap и добавляют URL в очередь на сканирование. Для больших сайтов используется sitemapindex — файл, ссылающийся на несколько sub-sitemap.
Где используется
- Ускорение индексации новых страниц
- Указание актуальной даты изменения контента
- Разделение по типам контента: страницы, статьи, изображения, видео
- Отправка через Google Search Console и Яндекс Вебмастер
Пример структуры
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://site.ru/page/</loc>
<lastmod>2024-01-15</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Частые ошибки
- Добавлять страницы с тегом noindex — противоречие сигналов
- Не обновлять
lastmodпосле изменений — Google перестаёт доверять дате - Включать страницы с ошибками 404 и 301-редиректами
- Не указывать путь к sitemap в robots.txt
Технически нет, но он значительно ускоряет индексацию. Особенно важен для новых сайтов, сайтов с большим количеством страниц или редко обновляемым контентом.