Дубли страниц — ситуация когда несколько URL сайта содержат одинаковый или очень похожий контент. Приводят к «каннибализации» — страницы конкурируют друг с другом, ссылочный вес размывается.

Как работает

Поисковик видит несколько версий одной страницы и не знает, какую индексировать и ранжировать. Crawl budget тратится на дубли вместо уникального контента. Ссылочный вес делится между версиями вместо консолидации на одном URL.

Типичные причины дублей

  • URL-параметры: /product/?color=red, /product/?utm_source=vk
  • Версии с www и без: www.site.ru и site.ru
  • HTTP и HTTPS версии без редиректа
  • Слеш в конце URL: /page/ и /page
  • Страницы пагинации с дублирующимся контентом

Способы устранения

  • Canonical тег — указать предпочтительный URL
  • 301-редирект — перенаправить с дубля на основную версию
  • Noindex — закрыть от индексации дублирующиеся страницы

Частые ошибки

  • Не настроить редирект с http на https при переезде
  • Игнорировать параметры фильтрации в интернет-магазинах
  • Один и тот же контент на нескольких URL без canonical