Пагинация в noindex: обзор всех методов, советы что можно делать и чего не стоит
Для улучшения SEO параметров сайта важно следить за количеством объектов в поиске. Не зная принципов создания страниц в WordPress можно наплодить кучу ненужных документов в выдаче. Одним из факторов является постраничная навигация, или по другому пагинация. От вебмастера требуется обернуть пагинацию в noindex.
В чем проблема пагинации и отказ от nofollow
В процессе развития сайта WordPress, записей становиться больше, тогда они не помещаются в ленте блога, внизу появляется кнопки пагинации.
При заходе на любую из них в адресной строке появляются конструкции типа /page/3 и цифра меняется в зависимости на какую ссылку нажали.
Все page не несут в себе пользы, это автоматические документы, к которым нельзя написать title и description. Но поисковые роботы забирают в индекс, чем понижают релевантность остальных записей. От них нужно избавляться, точнее закрывать в тег noindex. Так он должен выглядеть в исходном коде сайта. Рекомендую почитать про заголовок Last modified.
<meta name="robots" content="noindex,follow"/>
Что значит эта запись, что индексировать нельзя, а переходить по ссылкам можно follow. Никогда не пользуйтесь закрытием на переход с помощью nofollow, это негативно скажется на продвижении.
Noindex для пагинации с помощью плагина
Существует отличный плагин Clearfy Pro, имеющий около 50 настроек чистки кода, сео оптимизации, удаления дублей, настройка редиректов и много дополнительных функций. Заходим на вкладку SEO и включаем раздел “Noindex для пагинации”
- После заходим на любую пагинацию, нажимаем комбинацию клавиш Ctrl+U
- Ищем атрибут noindex. Воспользуемся нажатием Ctrl+f и вводим noindex
- Видим что тег поставился
Настройка в плагине All in one SEO pack
Не люблю плагин All in one SEO pack (AIOSP), но в отличие от знаменитого Yoast у него есть надстройка для закрытия от индексации пагинации.
В основном окне спускаемся в раздел “Настройки индексирования” и отмечаем чекбокс напротив “Использовать noindex для страниц/записей с разбивкой на подстраницы”.
С помощью кода в function
Требует навыков редактирования кода темы. В файл function активной, а лучше дочерней, темы добавляем вниз такой код.
function wpcourses_noindex_paged() {
if ( is_paged() ){
echo '<meta name="robots" content="noindex,follow">';
}
}
add_action( 'wp_head', 'wpcourses_noindex_paged', 2 );
Не забываем обновлять документ и проверять работу. Лучше использовать соединение через FTP для надежности, чтобы можно было вернуть исходную конфигурацию и удалить ошибку при возникновении поломки. Для лучшего понимания материала приложу свое видео.
Для надежности закрываем в Robots txt
Чтобы еще конкретнее дать понять поисковым роботам что страницы пагинации в индекс не брать нужно прописать строчку
Disallow: */page или Disallow: */page/
Первый вариант для тех у кого вывод страниц настроен с помощью префикса page, а второй более конкретный закрывает только пагинацию.
Для лучшего понимания это не атрибут noindex, а рекомендация для поисковых систем, что лучше туда не ходить, потому что информация для поиска не полезная. Об актуальном robots txt говорили в статье.
Не использовать rel canonical
Тег canonical указывает какую страницу считать основной для индексации. То есть если находимся на /page/6, то canonical укажет что основную брать в оборот:
<link rel="canonical" href="https://site.com/page/" />
Такой подход не правильно скажется на продвижении рессурса, потому что rel="canonical" сразу обрежет доступ и поиск ее не проверит. Это чревато вылетом старых записей из поиска, потому что единственный путь зачастую до материала лежит только через пагинацию. В таких случаях спасет XML карта сайта, но не точно.
Логика поведения
Проворачиваем в голове логику поведения роботов при заходе на пагинацию:
- Идет на страницу, видит в коде noindex, значит не стоит помещать в выдачу
- Для уверенности смотрит в robots, да не нужно их забирать в базу, потому что есть dissallow
- Видит тег follow, значит можно исследовать HTML на предмет дополнительных переходов и ссылок
- Canonical нет, значит это самостоятельный динамический документ, который не нужно размещать в интернете, но изучать можно
В итоге получаем правильную логику поведения роботов Яндекса и Гугла, на всех наших сайтах стоит данная схема и все работает отлично.
В результате максимально скажете роботам, что страницы типа пагинации брать в выдачу не надо, потому что проставлен noindex и настроено правило в роботсе.
Пожалуйста, оцените материал:
Добрый день. Я так понял из этой статьи, в Clearfy Pro раздел Canonical для пагинации не включать? Только включить Noindex для пагинации? Если так, то зачем эта функция Canonical в плагине?
Здравствуйте. Да лучше действовать так для информационных сайтов и блогов, canonical можно проставить например для магазинов и других направлений. В этом и поможет этот пункт в плагине, он закроет с помощью canonical любые страницы которые формируются с помощью функции вывода пагинации.
А еще такой вопрос. В пагинации главной тайтл будет таким главная/страница 2, главная/страница 3, и.тп. Адреса главная/page2, главная/page3. Ну и в категориях также. А вот что с заголовком h1, он должен повторятся на страницах пагинации, это нормально? То есть заголовок на главной к примеру – “скрипты”, и на страницах пагинации тоже “скрипты”
У нас тайтл в пагинациях совпадает с тайтлом главной страницы. По поводу H1, в пагинации это сам заголовок сайта. По поводу H1 в категориях, метках и других таксономиях, то H1 должен быть название этой рубрики, метки и т.д.
Использовал ваш код, но он работает на страницы указанные в примере. У меня после доменного имени url выглядит /comment-page-21/ , как мне быть?
Это уже более специфичные страницы, советую тогда использовать плагины.
Добрый день. Я вставил ваш код , на страницах пагиноции действительно появился noindex на страницы page/2/ все равно в индексе Яндекс. Яндекс прислал сообщение что просто поменял тайтл и дискрипшен. Что не так? Да еще вопрос на страницах пагинации canonical страницы указывает сам на себя.
скажите помимо кода надо еще и robot запретить?
Тут уже нужно смотреть, потому что много админов делают дополнительные папки, либо плагины делают их, поэтому приходится иногда лезть на сервер и смотреть что запретить роботу.
Добрый вечер.
Может вы мне поможете!? Ищу весь день и не могу найти ответа.
Как скрыть от индексации категории, меню именно на странице товара? Может тоже есть какая проверка? Сайт 8mile.by
Заранее благодарствую!
Новый meta name robots добавился, а вот как старый убрать то? В итоге 2 meta name robots, первый index, второй noindex.
Здравствуйте! Очень внимательно читала статью, хотела воспользоваться методом закрытия в noindex пагинация через код, однако код на вашем скриншоте и в тексте отличается. Какой верный?