Полное руководство по каноническим URL-адресам

Опубликовано: 2022-03-17

Когда на двух или более страницах появляется абсолютно одинаковый или почти одинаковый контент, это называется дублированным контентом. Самая большая проблема с дублированным контентом заключается в том, что поисковые системы не знают, какую версию контента индексировать или показывать в результатах поиска. Также сложно понять, куда направить такие показатели, как авторитет и доверие. И когда другим сайтам нужно выбирать между дублирующими версиями контента, на которые можно ссылаться, можно выбрать любую из многих ссылок, что снижает ссылочный вес. Вот тут-то и появляются канонические URL-адреса. Они используются для устранения проблем, связанных с дублирующимся контентом, что может улучшить ваш рейтинг в поисковых системах.

Что такое канонические URL-адреса?

Канонический URL-адрес, на который ссылаются из-за HTML-тега rel="canonical" , — это то, что поисковые системы используют для поиска основной версии контента, когда на одном веб-сайте или на разных веб-сайтах существует несколько версий страницы.

Например, допустим, вы публикуете сообщение в блоге на своем собственном веб-сайте. Затем вы также хотите опубликовать эту запись в блоге в своих учетных записях LinkedIn и Medium. С помощью канонического тега вы можете сообщить поисковым системам, что даже если одна и та же запись в блоге находится на нескольких веб-сайтах, та, которая находится на вашем веб-сайте, является основной версией, которая должна отображаться в результатах поиска.

И имейте в виду, что технически канонический URL-адрес на самом деле не является URL-адресом — это скорее тег, прикрепленный к URL-адресу, чтобы сообщить его значение поисковым системам. Если фактический URL выглядит как http://example.com/blogpost , каноническая версия будет выглядеть так:

Канонические URL-адреса

Вы не можете перейти на этот канонический URL, как на основной URL. Вместо этого канонизированная версия помещается в HTML-код страницы (или назначается для страницы через плагин).

Почему вы должны использовать канонические URL-адреса

Канонизация URL-адреса сообщает поисковой системе, какая версия страницы является основной, и именно эта страница должна отображаться в результатах поиска, а не другие дубликаты страницы. Когда люди ищут контент, на который можно сделать обратную ссылку, появится канонизированная страница, и они выберут ту, которая создаст ссылочный вес. Более того, метрики для части контента консолидируются для одной страницы, что делает ваши отчеты по метрикам более надежными.

Как правильно использовать канонические теги

Допустим, на вашем веб-сайте (или на двух разных веб-сайтах) есть дублированный контент, но основной версией, на которую вы хотите указать поисковым системам, является http://example.com/blogpost .

Канонический тег, который вы добавляете в исходный код сообщения в блоге (раздел заголовка HTML-кода страницы), будет выглядеть следующим образом:

Канонические URL-адреса

Если вы используете WordPress, вам не нужно возиться с HTML-кодом, как на некоторых других платформах CMS. Вместо этого вы можете использовать плагин и установить канонический URL-адрес для каждой страницы. Мы вернемся к этому чуть позже.

Канонические URL-адреса и скопированный контент

Скопированный контент может быть проблемой. Канонические URL-адреса позволяют любому, кто собирается копировать контент, знать, какой тег использовать в заголовке своей страницы. Копировщик, однако, обязан сообщить поисковым системам, что они скопировали контент, поместив rel="canonical" в заголовок своего сайта и указав обратно на ваш контент.

В других случаях вы можете быть копировщиком. Например, это обычное дело для пресс-релизов. Вы можете сначала опубликовать пресс-релиз на сайте своей компании, но указать исходный источник контента в сети синдикации. Это сделало бы вас синдикатором, а не первоначальным издателем — по крайней мере, согласно поисковым системам.

Однако следует отметить, что включение канонического URL в копируемый контент не всегда необходимо. Или иногда игнорируется. Поисковые системы отлично справляются с поиском истинного первоисточника контента. Итак, если вы собираетесь использовать канонический URL-адрес для указания на неоригинальный, как в приведенном выше примере с пресс-релизом, просто знайте, что поисковая система может его проигнорировать. Используйте эту тактику по своему усмотрению. Это своего рода неприятная серая зона для SEO, если не полная тактика черной шляпы.

Выбор структуры URL

Даже если вы не думаете, что у вас есть дублированный контент где-либо в Интернете, структура ваших URL-адресов может случайно создавать дублирующийся контент. Например, даже если следующие URL-адреса отображают один и тот же контент, и вы считаете их одной и той же страницей, поисковые системы рассматривают их как отдельные:

  • http://www.examplesite.com – здесь есть «www»
  • http://examplesite.com – здесь нет «www»
  • https://examplesite.com — здесь вместо «http» указано «https».
  • http://www.examplesite.com/ — в конце есть косая черта.

Существуют также вариации в HTTPS, косой черте и www. Все они рассматриваются поисковыми системами как отдельные страницы.

Это означает, что вам нужно принять окончательное решение о структуре ваших URL-адресов. Затем используйте эту структуру везде — на своем сайте и везде, где вы ссылаетесь на свой сайт. Если вам нужно обновить свои URL-адреса, используйте структуру, которую вы используете чаще всего, чтобы сделать этот процесс менее утомительным. Однако, если вы получаете конфиденциальную информацию через свой веб-сайт, например информацию о кредитной карте, вам следует использовать HTTPS.

Дублированный контент также может быть случайно создан вашими категориями и тегами WordPress. Например, эти два URL-адреса могут вести на одну и ту же страницу, но поисковая система увидит их как две отдельные страницы с дублирующимся содержимым:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Вы можете захотеть, чтобы пользователи находили шоколадные трюфели независимо от того, ищут ли они товары в категории «Конфеты» или «Еда» на вашем веб-сайте. Но поисковым системам все равно нужно знать, какой из них ранжировать в результатах поиска. Вот почему большинство SEO-плагинов, таких как Yoast и Rank Math, предлагают возможность деиндексировать страницы ваших архивов. Таким образом, эти дубликаты не будут отображаться для робота Googlebot и его аналогов.

Когда не следует использовать канонические URL-адреса

Когда дело доходит до переадресации 301, возможно, вы не захотите использовать канонический тег. Подумайте о разнице следующим образом: перенаправление означает, что контент появляется только в одном месте, и вы заставляете всех посетителей переходить на эту страницу. С другой стороны, с каноническим URL-адресом могут существовать и просматриваться несколько страниц, содержащих один и тот же контент, с одним исходным источником, предназначенным для поисковых систем.

Кроме того, URL-элемент rel="canonical" не является решением всех проблем с дублированием контента. SEO — сложная тема, и иногда более подходящим решением является использование файла robots, чтобы не индексировать страницу. Рекомендуется не индексировать страницы, которые не являются желательными точками входа на ваш сайт, а также страницы, которые не очень полезны для большинства посетителей. Например, вам действительно нужно, чтобы ваша страница с условиями и положениями отображалась в результатах поиска? Возможно нет. Но ваши сообщения в блогах, описания продуктов и страницы продаж? Определенно.

Также рекомендуется ознакомиться со статьей Google с пятью распространенными ошибками при использовании тега canonical. Вы не можете быть намного лучше, чем то, что говорит Google напрямую.

Как канонические URL-адреса влияют на SEO?

Теперь, хотя мы настоятельно рекомендуем вам устранять проблемы с дублирующимся контентом, используя канонические URL-адреса, важно отметить, что Google технически не наказывает сайты за публикацию дублированного контента. Однако это может повредить вашему рейтингу в поисковых системах, что в любом случае похоже на наказание. Когда поисковым системам трудно определить, какая версия контента является главной, ни одна версия не получает высокого рейтинга.

Также возможно, что поисковая система выберет неправильную версию и свяжется с ненадежным сайтом, а это означает, что он может вообще не щелкнуть и не прочитать, если пользователям не нравится, как выглядит URL-адрес. Кроме того, когда на вашем веб-сайте есть дублированный контент, ваш краулинговый бюджет расходуется. Поисковые системы сканируют и повторно сканируют веб-сайты, чтобы найти новый контент, и если на вашем сайте есть дублированный контент, сканирование всего этого занимает больше времени. Это означает, что поисковой системе потребуется больше времени, чтобы проиндексировать эти новые страницы и ранжировать их в результатах поиска.

Вы можете глубже погрузиться в эту тему, прочитав наше Полное руководство по дублированию контента и SEO. У Google также есть полезная страница о объединении повторяющихся URL-адресов.

Как установить канонический URL

В этом разделе мы расскажем вам, как установить канонический URL-адрес на WordPress и на веб-сайте, отличном от WordPress.

Установите канонический URL-адрес с помощью WordPress

Хотя вы можете установить канонические URL-адреса без плагина WordPress, мы считаем, что лучший, самый надежный и гибкий вариант — использовать плагин. В этом пошаговом руководстве мы используем Yoast SEO.

После установки и активации Yoast SEO откройте страницу или пост WordPress. Прокрутите вниз до конца поста, пока не дойдете до поля Yoast SEO. Выбрав вкладку SEO (она будет по умолчанию), прокрутите вниз и нажмите « Дополнительно » . В нижней части появившегося меню вы увидите слот с надписью Canonical URL .

Канонические URL-адреса

Введите полный URL-адрес в это поле, затем сохраните изменения в сообщении или на странице.

All in One SEO и Rank Math SEO — два других плагина, которые вы, возможно, захотите рассмотреть.

Установите канонический URL-адрес за пределами WordPress

Если вы не используете WordPress, вы все равно можете установить канонические URL-адреса. Во-первых, вам нужно получить доступ к HTML-коду веб-страницы. У каждого веб-конструктора будет свой собственный процесс, но его довольно легко найти. Например, вот как добавить код на сайт Wix. Процесс аналогичен для большинства сборщиков, отличных от WP, и платформ CMS; вам просто нужно найти, где они позволяют редактировать страницу/публикацию HTML.

Затем вы добавите URL-адрес с тегом rel="canonical" , включенным в раздел заголовка. Используя приведенный ниже пример, замените http://example.com/blogpost своим URL-адресом:

Канонические URL-адреса

Заголовок HTML — это первая часть кода. Он открывается с и закрывается с. Вот пример:

пример канонического URL в html

Чтобы добавить код в раздел head, вы должны поместить его где-то между тегами open и close. Лучше всего добавить ссылку над закрывающим тегом, чтобы все было организовано.

Как найти канонический URL

Если вы хотите узнать, имеет ли веб-страница назначенный канонический URL-адрес, это очень просто. Откройте страницу, затем щелкните правой кнопкой мыши, чтобы открыть меню. Выберите « Показать исходный код страницы» (или любой другой вариант, близкий к этому, например «Просмотреть исходный код страницы »). Откроется исходная страница с HTML-кодом. Вверху вы должны увидеть головную часть. Проверьте в этом разделе тег rel="canonical".

Канонические URL-адреса

Как удалить канонический URL

Удалить канонический URL тоже довольно просто. Вы просто делаете те же шаги, что и для добавления URL-адреса, но на этот раз удаляете его. Если вы использовали такой плагин, как Yoast, вы можете зайти на страницу и удалить канонический URL-адрес из соответствующего поля. Если вы добавили его непосредственно в HTML-код страницы, вы можете просто удалить его, а затем обновить страницу. По этой же причине рекомендуется всегда добавлять канонические URL-адреса в одно и то же место, например, прямо над закрывающим тегом head.

Заключительные мысли о канонических URL-адресах

Чем больше страниц у вас есть на вашем веб-сайте, тем трудоемче будет внедрение вашей стратегии канонических URL-адресов. Вот почему лучше решить эту проблему как можно раньше и следить за тем, где ваш контент повторно публикуется в Интернете. Благодаря полезным плагинам WordPress, таким как Yoast SEO, установка канонических URL-адресов проще, чем доступ к HTML-коду каждой страницы и редактирование кода вручную.

Каковы ваши рекомендации по использованию канонических URL-адресов? Дайте нам знать об этом в комментариях!

Изображение статьи Thepanyo / Shutterstock.com