Пагинация в noindex: обзор всех методов, советы что можно делать и чего не стоит

Для улучшения SEO параметров сайта важно следить за количеством объектов в поиске. Не зная принципов создания страниц в WordPress можно наплодить кучу ненужных документов в выдаче. Одним из факторов является постраничная навигация, или по другому пагинация. От вебмастера требуется обернуть пагинацию в noindex.

В чем проблема пагинации и отказ от nofollow

В процессе развития сайта WordPress, записей становиться больше, тогда они не помещаются в ленте блога, внизу появляется кнопки пагинации.

Как выглядит pagination в вордпресс
Пример пагинации WordPress

При заходе на любую из них в адресной строке появляются конструкции типа /page/3 и цифра меняется в зависимости на какую ссылку нажали.

Объекты типа page/3
Вывод page/

Все page не несут в себе пользы, это автоматические документы, к которым нельзя написать title и description. Но поисковые роботы забирают в индекс, чем понижают релевантность остальных записей. От них нужно избавляться, точнее закрывать в тег noindex. Так он должен выглядеть в исходном коде сайта. Рекомендую почитать про заголовок Last modified.

 <meta name="robots" content="noindex,follow"/> 

Что значит эта запись, что индексировать нельзя, а переходить по ссылкам можно follow. Никогда не пользуйтесь закрытием на переход с помощью nofollow, это негативно скажется на продвижении.

Noindex для пагинации с помощью плагина

Существует отличный плагин Clearfy Pro, имеющий около 50 настроек чистки кода, сео оптимизации, удаления дублей, настройка редиректов и много дополнительных функций. Заходим на вкладку SEO и включаем раздел “Noindex для пагинации”

Опция в плагине Clearfy PRO для ноуиндекс
Clearfy PRO включение noindex
  • После заходим на любую пагинацию, нажимаем комбинацию клавиш Ctrl+U
  • Ищем атрибут noindex. Воспользуемся нажатием Ctrl+f и вводим noindex
  • Видим что тег поставился
Проверяем появился noindex
Проверка работы

Настройка в плагине All in one SEO pack

Не люблю плагин All in one SEO pack (AIOSP), но в отличие от знаменитого Yoast у него есть надстройка для закрытия от индексации пагинации.

Закрытие индексации в AIOSP
All in one SEO pack включение noindex

В основном окне спускаемся в раздел “Настройки индексирования” и отмечаем чекбокс напротив “Использовать noindex для страниц/записей с разбивкой на подстраницы”.

С помощью кода в function

Требует навыков редактирования кода темы. В файл function активной, а лучше дочерней, темы добавляем вниз такой код.

function wpschool_noindex_paged() {
    if ( is_paged() ){
        ?>
<meta name="robots" content="noindex,follow">
        <?php
    }
}
add_action( 'wp_head', 'wpschool_noindex_paged', 2 );
Добавление конфигурации закрытия индекса в functin
Код в function.php

Не забываем обновлять документ и проверять работу. Лучше использовать соединение через FTP для надежности, чтобы можно было вернуть исходную конфигурацию и удалить ошибку при возникновении поломки. Для лучшего понимания материала приложу свое видео.

Для надежности закрываем в Robots txt

Чтобы еще конкретнее дать понять поисковым роботам что страницы пагинации в индекс не брать нужно прописать строчку

 Disallow: */page или Disallow: */page/
Пример валидного robots.txt
Правильный роботс

Первый вариант для тех у кого вывод страниц настроен с помощью префикса page, а второй более конкретный закрывает только пагинацию.

Для лучшего понимания это не атрибут noindex, а рекомендация для поисковых систем, что лучше туда не ходить, потому что информация для поиска не полезная. Об актуальном robots txt говорили в статье.

Не использовать rel canonical

Тег canonical указывает какую страницу считать основной для индексации. То есть если находимся на /page/6, то canonical укажет что основную брать в оборот:

<link rel="canonical" href="https://site.com/page/" />

Такой подход не правильно скажется на продвижении рессурса, потому что rel="canonical" сразу обрежет доступ и поиск ее не проверит. Это чревато вылетом старых записей из поиска, потому что единственный путь зачастую до материала лежит только через пагинацию. В таких случаях спасет XML карта сайта, но не точно.

Логика поведения

Проворачиваем в голове логику поведения роботов при заходе на пагинацию:

  • Идет на страницу, видит в коде noindex, значит не стоит помещать в выдачу
  • Для уверенности смотрит в robots, да не нужно их забирать в базу, потому что есть dissallow
  • Видит тег follow, значит можно исследовать HTML на предмет дополнительных переходов и ссылок
  • Canonical нет, значит это самостоятельный динамический документ, который не нужно размещать в интернете, но изучать можно

В итоге получаем правильную логику поведения роботов Яндекса и Гугла, на всех наших сайтах стоит данная схема и все работает отлично.

В результате максимально скажете роботам, что страницы типа пагинации брать в выдачу не надо, потому что проставлен noindex и настроено правило в роботсе.

Пожалуйста, оцените материал:

Давно занимаюсь и разрабатываю сайты на Wordpress. Считаю что лучшего решения для ведения бизнеса не найти, поэтому считаю долгом делиться информацией с остальными.
Получай полезные материалы удобным способом!

9 thoughts on “Пагинация в noindex: обзор всех методов, советы что можно делать и чего не стоит

  1. Добрый день. Я так понял из этой статьи, в Clearfy Pro раздел Canonical для пагинации не включать? Только включить Noindex для пагинации? Если так, то зачем эта функция Canonical в плагине?

    1. Здравствуйте. Да лучше действовать так для информационных сайтов и блогов, canonical можно проставить например для магазинов и других направлений. В этом и поможет этот пункт в плагине, он закроет с помощью canonical любые страницы которые формируются с помощью функции вывода пагинации.

  2. А еще такой вопрос. В пагинации главной тайтл будет таким главная/страница 2, главная/страница 3, и.тп. Адреса главная/page2, главная/page3. Ну и в категориях также. А вот что с заголовком h1, он должен повторятся на страницах пагинации, это нормально? То есть заголовок на главной к примеру – “скрипты”, и на страницах пагинации тоже “скрипты”

    1. У нас тайтл в пагинациях совпадает с тайтлом главной страницы. По поводу H1, в пагинации это сам заголовок сайта. По поводу H1 в категориях, метках и других таксономиях, то H1 должен быть название этой рубрики, метки и т.д.

  3. Использовал ваш код, но он работает на страницы указанные в примере. У меня после доменного имени url выглядит /comment-page-21/ , как мне быть?

    1. Это уже более специфичные страницы, советую тогда использовать плагины.

  4. Добрый день. Я вставил ваш код , на страницах пагиноции действительно появился noindex на страницы page/2/ все равно в индексе Яндекс. Яндекс прислал сообщение что просто поменял тайтл и дискрипшен. Что не так? Да еще вопрос на страницах пагинации canonical страницы указывает сам на себя.

    1. Тут уже нужно смотреть, потому что много админов делают дополнительные папки, либо плагины делают их, поэтому приходится иногда лезть на сервер и смотреть что запретить роботу.

Добавить комментарий