Дубли страниц: как найти и устранить

Апр 5, 2023 | Продвижение сайта | Нет комментариев

4.2
(5)

Дубли страниц — это страницы, где похожая или полностью повторяющаяся информация доступна по разным URL-адресам. Это плохо для SEO, так как поисковые системы могут снизить ранг сайта за неуникальность контента, а также разбросать вес ссылок между дублирующими страницами. Кроме того, дубли могут сбивать с толку пользователей и ухудшать конверсию сайта. В этой статье мы расскажем, какие бывают дубли страниц, как их обнаружить и как с ними бороться с помощью различных методов.

Какие бывают дубли страниц на сайте

Дубли страниц бывают полными и частичными. Полные дубли — это страницы, которые полностью совпадают по содержанию и доступны по разным URL-адресам. Частичные дубли — это страницы, которые совпадают на 80% и более.

Самые распространенные типы дублей страниц на сайте:

  • Два сайта с разными доменными именами, один из которых начинается на www, а другой — нет. Например: https://example.com и https://www.example.com
  • Дубли страниц с протоколами http и https. Например: http://example.com и https://example.com
  • Два разных файла с HTML разметкой. Например: https://example.com/index.html и https://example.com/home.html
  • Страницы с обратным слешем и без. Например: https://example.com/page и https://example.com/page/
  • Дубликаты с множественными слешами в середине либо в конце URL-адреса. Например: https://example.com/page// или https://example.com///
  • Дубли в верхнем и нижнем регистре. Например: https://example.com/page и https://example.com/PAGE
  • Страницы с разными параметрами в URL. Например: https://example.com/page?sort=asc и https://example.com/page?sort=desc

Как обнаружить дубли на сайте

Для поиска дублей на сайте можно использовать различные инструменты, например:

  • Вебмастер Яндекс и Google Search Console — позволяют увидеть, какие страницы сайта проиндексированы поисковиками и какие из них являются дублями.
  • Сервисы для проверки уникальности текстов — позволяют сравнить контент двух или нескольких страниц и определить процент совпадения. Например: Advego Plagiatus или Text.ru.
  • Сервисы для проверки сайта на дубли онлайн — позволяют найти дубликаты страниц по разным адресам URL, например: Liftweb.

Как бороться с дублями страниц на WordPress

WordPress — одна из самых популярных CMS для создания сайтов и блогов. Однако, как и любая другая система, она не застрахована от появления дублей страниц, которые могут негативно сказаться на SEO и пользовательском опыте. Как же найти и устранить дубли на WordPress? Вот несколько советов:

Используйте плагины для управления дублями

Самый простой и удобный способ бороться с дублями на WordPress — это использовать специальные плагины, которые помогут вам обнаружить и устранить дублирующие страницы. Например, вы можете использовать такие плагины:

  • Yoast SEO — один из самых популярных и мощных плагинов для SEO-оптимизации сайта на WordPress. С его помощью вы можете не только настраивать мета-теги, карту сайта, хлебные крошки и другие параметры, но и убирать дубли страниц с помощью атрибута rel=»canonical». Также вы можете указать канонический URL для каждой страницы вручную в редакторе записей или страниц.
  • All In One SEO Pack — еще один популярный плагин для SEO-оптимизации сайта на WordPress. Он также позволяет вам убирать дубли страниц с помощью атрибута rel=»canonical». Также вы можете указать канонический URL для каждой страницы вручную в редакторе записей или страниц.

Настройте перенаправления в файле .htaccess

Если вы не хотите использовать плагины или хотите иметь больше контроля над перенаправлениями, вы можете настроить 301 редиректы в файле .htaccess, который находится в корневой папке вашего сайта. В этом файле вы можете прописать различные правила для перенаправления URL-адресов. Например, если вы хотите перенаправить все страницы с www на без www, то вы можете добавить такой код:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.site.ru [NC]
RewriteRule ^(.*)$ https://site.ru/$1 [L,R=301]

Если вы хотите перенаправить все страницы с http на https, то вы можете добавить такой код:

RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Если вы хотите перенаправить конкретную страницу на другую, то вы можете добавить такой код:

Redirect 301 /old-page https://site.ru/new-page

Запретите индексацию дублирующих страниц

Еще один способ борьбы с дублями на WordPress — это запретить поисковым системам индексировать дублирующие страницы с помощью специальных мета-тегов или файла robots.txt. Например, если вы хотите запретить индексацию всех страниц с параметрами, например, replytocom, sortby и т.д., то вы можете добавить в тег каждой страницы мета-тег robots со значением noindex. Например:

<meta name=“robots” content=“noindex” />

Таким образом, вы сообщаете поисковикам, что эти страницы не нужно индексировать и показывать в результатах поиска. Добавить этот тег можно как вручную, так и с помощью SEO плагинов, описанных выше.

Если вы хотите запретить индексацию определенных разделов сайта, например, архивов, категорий или тегов, то вы можете использовать файл robots.txt, который находится в корневой папке вашего сайта. В этом файле вы можете прописать различные правила для запрета индексации URL-адресов. Например, если вы хотите запретить индексацию всех архивов по месяцам и годам, то вы можете добавить такой код:

User-agent: *
Disallow: /20*/

Таким образом, вы сообщаете поисковикам, что не нужно индексировать все URL-адреса, начинающиеся с /20 (например, /2021/04/).

Следите за структурой и навигацией сайта

Наконец, один из лучших способов предотвратить появление дублей на WordPress — это следить за структурой и навигацией сайта. Старайтесь делать ваш сайт логичным и удобным для пользователей и поисковых роботов. Избегайте излишней вложенности и дублирования разделов. Используйте хлебные крошки для обозначения положения страницы на сайте. Удаляйте или объединяйте старые или неактуальные страницы. Ссылайтесь на свои страницы с правильными URL-адресами и анкорами. Используйте карту сайта для облегчения индексации и ориентации на сайте.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 4.2 / 5. Количество оценок: 5

Оценок пока нет. Поставьте оценку первым.

Наш телефон:

+7 (499) 70-30-435

Книга в подарок

Вопросы пишите в саппорт: https://wpkurs.ru/cms/system/contact
Контакты службы работы с клиентами: +7 (499)-70-30-435
Адрес: г. Уфа, ул. Ленина, дом 28, а/я 25

© ТЦ «Интернет-Прорыв» 2012-2020 | ИП Гадельшин Адель Раисович. ОГРН: 314028000006317. ИНН: 026824242756