Дубли страниц — ситуация когда несколько URL сайта содержат одинаковый или очень похожий контент. Приводят к «каннибализации» — страницы конкурируют друг с другом, ссылочный вес размывается.
Как работает
Поисковик видит несколько версий одной страницы и не знает, какую индексировать и ранжировать. Crawl budget тратится на дубли вместо уникального контента. Ссылочный вес делится между версиями вместо консолидации на одном URL.
Типичные причины дублей
- URL-параметры:
/product/?color=red,/product/?utm_source=vk - Версии с www и без:
www.site.ruиsite.ru - HTTP и HTTPS версии без редиректа
- Слеш в конце URL:
/page/и/page - Страницы пагинации с дублирующимся контентом
Способы устранения
- Canonical тег — указать предпочтительный URL
- 301-редирект — перенаправить с дубля на основную версию
- Noindex — закрыть от индексации дублирующиеся страницы
Частые ошибки
- Не настроить редирект с http на https при переезде
- Игнорировать параметры фильтрации в интернет-магазинах
- Один и тот же контент на нескольких URL без canonical