Дублирование контента. Как решить эту проблему?

Дублирование контента — адский кошмар для SEO-специалистов и индустрии в целом. Очевидно, что вы должны заботиться о создании уникального контента, но достаточно ли ваших усилий для этого? Как дублирование контента работает на практике? Влияете ли вы на это в каждом конкретном случае? Как проверить, не дублируется ли ваш контент, и что делать, если это произойдет?

Что такое дублирование контента?

Короче говоря: дублирование контента — это ситуация, когда один и тот же текст появляется на нескольких разных веб-сайтах или в нескольких разных местах на одном веб-сайте. Дублирование контента обычно рассматривается как копирование контента от кого-то другого, но это не единственный источник.

Вы можете разделить дублирование контента на два типа: внешнее и внутреннее.

Первый тип — внешний — будет отображаться за пределами вашего сайта (как один и тот же фрагмент контента в нескольких местах со ссылками на ваш сайт). Второй тип — появляется на вашем сайте (например, идентичная статья на многих подстраницах). Внутренний тип — это тот, о котором часто забывают предприниматели электронной коммерции, которые обычно трубят в трубку о так называемых «уникальных» описаниях.

К сожалению, они, кажется, забывают о том, что нельзя добавлять одно и то же описание к нескольким товарам (или даже к нескольким вкладкам, например, к разным цветам одной и той же рубашки).

Как для внутреннего, так и для внешнего копирования, копирование контента вызвано преднамеренным действием или игнорированием некоторых технических проблем. Неважно, каковы были причины — правда в том, что это затруднит позиционирование в поисковых системах и сделает веб-сайт менее заметным в Google.

Алгоритм Google под названием Panda, выпущенный в феврале 2011 года определенно распознает дублирование контента. Основная цель этого алгоритма — позиционировать сайты с уникальным и ценным содержанием намного выше в результатах поиска Google.

Если по какой-то причине на вашем веб-сайте будет отсутствовать ценный контент или будет много повторяющихся статей, даже если они вам не нужны, Google может расценить ваши действия как преднамеренное манипулирование поисковой позицией веб-сайта и расценить ваши действия как попытку чтобы обманывать конечных пользователей. Затем Google может внести некоторые изменения в индексацию и положение веб-сайта в результатах поиска. В худшем случае, так как сайт может быть полностью удален из результатов поиска.

Каковы причины дублирования контента?

Google заявляет, что обычно дублирование контента не делается с целью обмана. Скорее это происходит из-за некоторых недосмотров или незнания. Посмотрим, каковы причины дублирования контента.

Причины дублирования внешнего контента

Так называемые клоны веб-сайта появляются, когда контент копируется другими веб-сайтами или когда вы копируете контент непосредственно с них. Это также происходит, когда на таких платформах, как Amazon или Idealo, вы размещаете точно такое же описание продуктов, как и на вашем собственном веб-сайте. Другой пример такой практики — размещение той же информации о компании в платных категориях, что и на веб-сайте, на который вы ссылаетесь, или если вы публикуете где-то статью в качестве гостевого поста, а затем повторяете ее на вашем сайте (или наоборот). Распространенной практикой является размещение того же описания компании, которое уже написано на их собственном веб-сайте. Это действие увеличивает дублирование внешнего контента.

Если вы управляете магазином, основанным на прямой поставке, и берете некоторую информацию непосредственно с других веб-сайтов, или вы являетесь производителем определенного продукта, и те, кто покупает его у вас, копируют ваши описания, то вам следует ограничить контент.

Продавцы нередко копируют описания прямо с таких сайтов, как Википедия. В этом нет смысла, потому что такие сайты обычно имеют действительно высокие параметры, и поэтому они будут ранжироваться и отображаться выше, чем те сайты, которые копировали контент. Неудивительно, что Google хочет показывать пользователям контент, который лучше всего подходит для них, а также является уникальным. Вы не добьетесь многого, если скопируете ваш текст.

Причины дублирования внутреннего контента

1. Идентичные тексты в описаниях категорий и продуктов.

Идентичные описания категорий и товаров — настоящая проблема в электронной коммерции. Это самая сложная проблема для устранения. Все, что описано ниже, можно решить с меньшими затратами за счет технической оптимизации.

С десятками или сотнями похожих товаров сложно придумать уникальные описания для каждой отдельной темы, особенно если у нее есть дополнительные вкладки.

Дублирование также вызывается фильтрацией, сортировкой и параметризацией, что является основным в электронной коммерции, и блокировкой одного и того же контента на последующих подстраницах (правила, нижний колонтитул с содержанием).

2. Главная страница доступна по нескольким адресам.

Если ваша домашняя страница доступна под несколькими разными адресами, это может быть одной из причин дублирования контента. Это произойдет, если адреса находятся в том же месте, что и:
http://www.website-address.com
http://website-address.com
http://www.website-address.com/index.html
http://website-address.com/index.html

Решение: правильное перенаправление между определенными версиями.

3. Неправильное перенаправление после добавления SSL-сертификата.

Если веб-сайт будет неправильно перенаправлен с http на https при внедрении сертификата SSL, вы можете ожидать, что поисковые системы увидят две страницы с одинаковым содержанием.

Решение? Делайте это с умом с SSL-сертификатом.

4. Неправильные языковые версии.

Еще одной причиной дублирования могут быть неверные языковые версии сайта. Это происходит, когда сайт переведен не полностью и, например, в его версии на иностранном языке у нас есть тексты на соответствующем языке, но названия продуктов по-прежнему указаны на первом языке. Также плохая идея — перевести текст с помощью Google Translator и вставить его в версию страницы на иностранном языке.

Решение: отдельный правильно переведенный текст для каждой языковой версии.

5. Дублированные теги заголовка и мета-дешифрования.

Часто на сайте есть повторяющиеся метатеги, что также может быть негативно воспринято Google. Это также происходит, когда вы не вводите различные теги заголовков и разные теги мета-описания на странице с большим количеством подстраниц. Чтобы браузерные роботы могли правильно интерпретировать страницу, элементы заголовка должны быть разными для каждой подстраницы. Метаописания менее важны, но когда они дублируются, они ослабляют позицию страницы. Также стоит ввести их вручную.

Решение: правильные метатеги.

6. Неоптимизированная разбивка на страницы.

Еще одна проблема — нумерация страниц. Это концепция в области полиграфии и книжного производства в целом, но она также заимствована из WWW. Это означает разбиение на страницы или дробление контента на части и размещение их на последующих подстраницах. Он используется так же, как и в книгах — чтобы помочь пользователю читать и просматривать, а также помогает им индексировать. Примерами могут служить результаты фильтрации товаров и их многостраничные списки. Если одинаковые теги description и title, идентичный текст и продукты появятся на каждой подстранице, клонирование произойдет снова.

Решение. Разделяйте описания тегов, заголовки, новый текст и другие продукты на каждой подстранице или подходящую пометку подстраниц в коде и в Google Search Console.

Как обнаружить дублирование контента

Итак, вы уже знаете, как дублировать контент. Пора узнать, как его отследить. Вы можете сделать это с помощью таких инструментов, как:
Ahrefs — благодаря ему вы можете проверить внутреннее дублирование.
Screaming Frog — отслеживает повторяющиеся подстраницы, метатеги, а также заголовки.
Sitebulb — также находит повторяющиеся подстраницы.
Siteliner — проверяет внутреннее дублирование.
Copyscape — здесь вы можете найти внешнее дублирование.
и… обычный гугл, в который вставляем фрагмент текста и проверяем, можно ли его где-нибудь найти

Дублированный контент — как от него избавиться?

Не всегда достаточно создать уникальный контент. Вы также не влияете на каждый отдельный фактор (один из примеров — вышеупомянутое взаимное копирование контента между различными веб-сайтами). Что вы можете сделать, чтобы исключить дублирующуюся информацию?

Если несколько ссылок ведут на главную страницу, вам следует исправить скрипт и ввести 301 редирект (что означает ссылку на другой веб-сайт — на тот, который вы хотите рассматривать как наиболее важный во всех существующих версиях главной страницы).

Аналогичным образом можно решить проблему с версиями с SSL или без него. Вы можете настроить предпочтительный домен в Google Search Console.

Избавиться от дублирования заголовков и метатегов можно, если вручную применить уникальные теги на каждой возможной подстранице.

Чтобы удалить дублирование контента в некоторых категориях продуктов, их описаниях и других вкладках, где они появляются, вы можете максимально использовать два решения: либо создать уникальные описания, либо ввести канонический параметр.

Для проблемных версий языков решением будет правильная реализация параметров hreflang.

Чтобы окончательно разобраться во всех проблемах с копированием, как и с нумерацией страниц, необходимо ввести канонический параметр, как и в вышеупомянутых категориях.

А как насчет сортировки? Вы можете контролировать для него другую подстраницу и блокировать индексацию, сортировку и фильтрацию результатов поиска в robots.txt.

В свою очередь, можно исключить дублирование во внешних сервисах, где вы по отдельности размещаете контент, такой как Allegro, Ceneo или социальные сети. Все, что вам нужно сделать, это подготовить отдельные уникальные тексты. Чтобы избежать копирования нашего контента конкурентами, стоит снова использовать канонические ссылки, а дату публикации следует указать на сайте и в схеме.

Заключительные слова

Подводя итог всем выводам, следует отметить, что не все считают дублирование контента плохой практикой. Даже Ahrefs указывает на это в своей статье «Дублирование контента — миф». Тем не менее, всегда полезно заботиться об уникальности и подлинности контента, чтобы повысить доверие пользователей.

Оставьте комментарий