Пагинация в noindex: обзор всех методов, советы что можно делать и чего не стоит

Для улучшения SEO параметров сайта важно следить за количеством объектов в поиске. Не зная принципов создания страниц в WordPress можно наплодить кучу ненужных документов в выдаче. Одним из факторов является постраничная навигация, или по другому пагинация. От вебмастера требуется обернуть пагинацию в noindex.

В чем проблема пагинации и отказ от nofollow

В процессе развития сайта WordPress, записей становиться больше, тогда они не помещаются в ленте блога, внизу появляется кнопки пагинации.

Как выглядит pagination в вордпресс
Пример пагинации WordPress

При заходе на любую из них в адресной строке появляются конструкции типа /page/3 и цифра меняется в зависимости на какую ссылку нажали.

Объекты типа page/3
Вывод page/

Все page не несут в себе пользы, это автоматические документы, к которым нельзя написать title и description. Но поисковые роботы забирают в индекс, чем понижают релевантность остальных записей. От них нужно избавляться, точнее закрывать в тег noindex. Так он должен выглядеть в исходном коде сайта. Рекомендую почитать про заголовок Last modified.

 <meta name="robots" content="noindex,follow"/> 

Что значит эта запись, что индексировать нельзя, а переходить по ссылкам можно follow. Никогда не пользуйтесь закрытием на переход с помощью nofollow, это негативно скажется на продвижении.

Noindex для пагинации с помощью плагина

Существует отличный плагин Clearfy Pro, имеющий около 50 настроек чистки кода, сео оптимизации, удаления дублей, настройка редиректов и много дополнительных функций. Заходим на вкладку SEO и включаем раздел «Noindex для пагинации»

Опция в плагине Clearfy PRO для ноуиндекс
Clearfy PRO включение noindex
  • После заходим на любую пагинацию, нажимаем комбинацию клавиш Ctrl+U
  • Ищем атрибут noindex. Воспользуемся нажатием Ctrl+f и вводим noindex
  • Видим что тег поставился
Проверяем появился noindex
Проверка работы

Настройка в плагине All in one SEO pack

Не люблю плагин All in one SEO pack (AIOSP), но в отличие от знаменитого Yoast у него есть надстройка для закрытия от индексации пагинации.

Закрытие индексации в AIOSP
All in one SEO pack включение noindex

В основном окне спускаемся в раздел «Настройки индексирования» и отмечаем чекбокс напротив «Использовать noindex для страниц/записей с разбивкой на подстраницы».

С помощью кода в function

Требует навыков редактирования кода темы. В файл function активной, а лучше дочерней, темы добавляем вниз такой код.

function wpschool_noindex_paged() {
    if ( is_paged() ){
        ?>
<meta name="robots" content="noindex,follow">
        <?php
    }
}
add_action( 'wp_head', 'wpschool_noindex_paged', 2 );
Добавление конфигурации закрытия индекса в functin
Код в function.php

Не забываем обновлять документ и проверять работу. Лучше использовать соединение через FTP для надежности, чтобы можно было вернуть исходную конфигурацию и удалить ошибку при возникновении поломки. Для лучшего понимания материала приложу свое видео.

Для надежности закрываем в Robots txt

Чтобы еще конкретнее дать понять поисковым роботам что страницы пагинации в индекс не брать нужно прописать строчку

 Disallow: */page или Disallow: */page/
Пример валидного robots.txt
Правильный роботс

Первый вариант для тех у кого вывод страниц настроен с помощью префикса page, а второй более конкретный закрывает только пагинацию.

Для лучшего понимания это не атрибут noindex, а рекомендация для поисковых систем, что лучше туда не ходить, потому что информация для поиска не полезная. Об актуальном robots txt говорили в статье.

Не использовать rel canonical

Тег canonical указывает какую страницу считать основной для индексации. То есть если находимся на /page/6, то canonical укажет что основную брать в оборот:

<link rel="canonical" href="https://site.com/page/" />

Такой подход не правильно скажется на продвижении рессурса, потому что rel="canonical" сразу обрежет доступ и поиск ее не проверит. Это чревато вылетом старых записей из поиска, потому что единственный путь зачастую до материала лежит только через пагинацию. В таких случаях спасет XML карта сайта, но не точно.

Логика поведения

Проворачиваем в голове логику поведения роботов при заходе на пагинацию:

  • Идет на страницу, видит в коде noindex, значит не стоит помещать в выдачу
  • Для уверенности смотрит в robots, да не нужно их забирать в базу, потому что есть dissallow
  • Видит тег follow, значит можно исследовать HTML на предмет дополнительных переходов и ссылок
  • Canonical нет, значит это самостоятельный динамический документ, который не нужно размещать в интернете, но изучать можно

В итоге получаем правильную логику поведения роботов Яндекса и Гугла, на всех наших сайтах стоит данная схема и все работает отлично.

В результате максимально скажете роботам, что страницы типа пагинации брать в выдачу не надо, потому что проставлен noindex и настроено правило в роботсе.

Пожалуйста, оцените материал:

Давно занимаюсь и разрабатываю сайты на Wordpress. Считаю что лучшего решения для ведения бизнеса не найти, поэтому считаю долгом делиться информацией с остальными.
Получай полезные материалы удобным способом!

4 thoughts on “Пагинация в noindex: обзор всех методов, советы что можно делать и чего не стоит

  1. Добрый день. Я так понял из этой статьи, в Clearfy Pro раздел Canonical для пагинации не включать? Только включить Noindex для пагинации? Если так, то зачем эта функция Canonical в плагине?

    1. Здравствуйте. Да лучше действовать так для информационных сайтов и блогов, canonical можно проставить например для магазинов и других направлений. В этом и поможет этот пункт в плагине, он закроет с помощью canonical любые страницы которые формируются с помощью функции вывода пагинации.

  2. А еще такой вопрос. В пагинации главной тайтл будет таким главная/страница 2, главная/страница 3, и.тп. Адреса главная/page2, главная/page3. Ну и в категориях также. А вот что с заголовком h1, он должен повторятся на страницах пагинации, это нормально? То есть заголовок на главной к примеру — «скрипты», и на страницах пагинации тоже «скрипты»

    1. У нас тайтл в пагинациях совпадает с тайтлом главной страницы. По поводу H1, в пагинации это сам заголовок сайта. По поводу H1 в категориях, метках и других таксономиях, то H1 должен быть название этой рубрики, метки и т.д.

Добавить комментарий

Ntrcn