Разборы

Что такое уникальность контента и нужно ли за ней следить

Уникальность контента

Контента в интернете очень много. И сделать что-то уникальное все сложнее и сложнее — практически обо всем кто-то уже писал или рассказывал. А что делать, если вы хотите написать о чем-то, о чем рассказывали уже тысячу раз? Решили разобраться и опросили для этого разных экспертов: главреда, SEO-специалиста, специалистов по рекомендательным системам и внешним площадкам, юристов. 

Материала получилось много, поэтому мы разделили его на 3 части. Это первая часть, в ней рассказываем о том, что такое уникальность контента, как она рассчитывается и как влияет на ранжирование сайтов в выдаче.

Что такое уникальность контента

Уникальность контента — это SEO-понятие. Оно означает оригинальность материалов и их распространенность в интернете. В плане текстов уникальность показывает, насколько часто встречаются конкретные фразы и отдельные слова на разных сайтах.

Уникальность измеряется в процентах. Т.е. если контент впервые публикуется в сети — он будет на 100% уникальным. А если кто-то просто скопирует чужой текст и разместит его на своем сайте, его уникальность будет равна нулю. Это же применимо к картинкам, графикам и т. д: если копировать их — будут неуникальными.

На что влияет уникальность контента и почему нельзя копировать чужие материалы

Уникальность контента влияет на отношение поисковиков к сайту и его ранжирование в топе поисковой выдачи. Чем больше уникального контента на сайте, тем лучше к нему будут относиться поисковые роботы. Об этом заявляют сами поисковые системы. 

В материале Яндекса о качестве сайтов написано: «Создавайте сайты с оригинальным контентом. А все сайты, которые содержат неоригинальный, вторичный, малополезный контент, а также сайты, создаваемые для продажи ссылок и заработка на рекламе, будут понижаться в выдаче или удаляться вовсе».

А Google во введении в поисковую оптимизацию рекомендует ориентироваться на интересы пользователей: «Создание привлекательного и полезного контента важнее для популярности сайта, чем любой другой фактор». А еще в справке Google написано, что полностью скопированное содержимое другого сайта не представляет для пользователей никакой ценности. 

Вот что в Google считается неуникальным контентом:

  • Материалы, которые публикуются на нескольких сайтах без дополнительной обработки или цитирования источника.
  • Материалы, которые публикуются на разных сайтах с незначительными изменениями. Например, тексты с синонимами или сделанные с помощью автоматической обработки. Подробнее об автоматической обработке читайте в справке Google.
  • Сайты, которые просто копируют или перенаправляют содержимое с других источников, но не добавляют ничего нового или полезного для пользователей.
  • Сайты, на которых публикуются различные компиляции контента: изображения, видео и прочие материалы с других сайтов без дополнительной пользы для читателей.

Но здесь есть оговорка: на отношение к сайту и его ранжирование влияет еще и польза размещаемого контента. Т.е. новостные сайты могут не делать тексты со 100%-ной уникальностью. Для них важнее разработать удобный сайт и сделать так, чтобы люди активно общались в комментариях, репостили записи и т.д. 

В этом случае поисковые системы будут считать, что сайт максимально соответствует запросам аудитории, и ранжировать его выше остальных.

Константин Рудов
Константин Рудов

Главред блога SMMplanner, ведет авторский блог в Telegram

Уникальность статей — тема очень неоднозначная. С одной стороны, уникальность — это положительный фактор ранжирования. С другой стороны, добиться высокой уникальности в ряде случаев невозможно. 

Например, высокой уникальности сложно добиться в юридических текстах. Когда мы пишем про недвижимость или что-то юридическое, нам приходится описывать процедуры определенными терминами. Т.е. мы пишем: сходите туда-то, подайте такое-то заявление, добейтесь подтверждения у нотариуса и т.д. И каждый раз в таких инструкциях важны точные формулировки. В итоге получается, что в разных статьях от разных авторов какие-то куски текста полностью сопадают.

Ситуация становится еще хуже, когда мы начинаем ссылаться на какие-то нормативные документы и законы или приводим выдержки из этих законов и документов. В этом случае уникальность часто падает до 20, 30 или 40%. Но при этом тексты все равно не выпадают из выдачи.

Можно привести другой пример — стихотворения. Если бы уникальность была суперважным фактором ранжирования, тогда опубликованные стихи Пушкина вообще бы не набирали трафика. Ведь вы же не будете каждый раз уникализировать стихотворение.

Из этого получается, что уникальность — важна, но не обязательна. Вы можете публиковать текст с невысокой уникальностью. Катастрофы от этого не произойдет, трафик все равно будет.

Что произойдет с сайтом, если публиковать на нем неуникальный контент

Главная проблема — упадет лояльность читателей. Со временем люди перестанут следить за сайтом, который не публикует уникального и полезного контента. А если блог работает как одна из первых воронок продаж, то компания потеряет много потенциальных клиентов и денег.

Кроме того, пострадает и сам сайт. Сначала упадет его посещаемость и снизятся позиции в выдаче. Когда поисковые системы пометят сайт как площадку с неуникальным контентом, отдельные страницы начнут выпадать из индексации. Из-за этого опять упадут показатели поискового трафика — станет еще меньше продаж и прибыли.

О том, что произойдет с сайтом при публикации неуникального контента, мы поговорили с ребятами, которые отвечают за SEO в Unisender.

SEO-специалисты Unisender
SEO-специалисты Unisender

Сайт с неуникальным контентом будет терять доверие поисковых систем, а в будущем — позиции в поисковой выдаче. Возможно, он даже получит автоматические или ручные санкции. Трафик точно не упадет до нуля, но динамика будет отрицательная.

При этом на сайте можно публиковать неуникальные картинки. Это не будет занижать позицию сайта в выдаче. С другой стороны, уникальные картинки могут помочь лучше ранжироваться материалу, потому что так будет соблюдаться больше факторов. Поэтому, например, уникальной стоит делать заглавную картинку статьи, которая ее характеризует и оптимизирована под основной запрос.

Отдельно стоит отметить молодые блоги, которые только начинают публиковать контент и собирать первую аудиторию. Для них уникальность очень важна. Поисковые системы не будут доверять сайту (особенно молодому), который выпускает некачественный копипаст. Но при этом не нужно упарываться и лить воду до уникальности в 100%.

Уникальность — важный фактор ранжирования. Но при этом в топе выдачи часто мелькают статьи с уникальностью в 50–60%. А иногда — еще ниже. И это не всегда тексты юридической тематики.

SEO-специалисты Unisender
SEO-специалисты Unisender

Увидеть в топе страницы с копипастом можно по разным причинам:

  • Это может быть временно. Например, ресурс украл чужой контент и с помощью ссылок и поведенческих факторов на время попал в топ. Очевидно, что это не долгосрочная перспектива. Кроме того, сайт может столкнуться с юридическими вопросами, если будет публиковать краденый контент.
  • Это может быть естественный процесс. Например, сайт давно опубликовал статью и попал в топ. А потом другие сайты частично использовали информацию из этой статьи в своих материалах и из-за этого уникальность просела.
  • Может быть, что конкурент украл контент с конкретной страницы и расплодил его на сотнях других сайтов, пытаясь просадить показатели.

Отметим — уникальность важна, но никто не заставляет делать материал со 100% уникальностью. Часто достаточно показателя 70–90%. А если уникальность ниже, то какой смысл в такой работе, если она фактически соткана из чужого материала?

Как на отношение к уникальности повлияют нейросети

Мы уже рассказывали, как нейросети повлияют на SEO, и затрагивали там тему уникальности. Здесь повторим кратко:

  • Нейросети могут делать уникальный контент по любой теме. Это значит, что в будущем поисковые системы могут изменить свое отношение к уникальности и в большей степени ранжировать статьи исходя из их пользы для читателей.
  • Google считает ИИ-контент спамом и занижает сайты с такими материалами в выдаче. И неважно, какая у него уникальность.

Пока что сложно сказать, как поисковые системы будут относиться к нейросетевому контенту. Мнения экспертов в этом вопросе расходятся.

Константин Рудов
Константин Рудов

Главред блога SMMplanner, ведет авторский блог в Telegram

В плане нейросетей проблема не столько в уникальности, сколько в большом количестве неотработанной семантики. Семантики, в которую входят слишком низкочастотные запросы, чтобы писать по ним отдельные статьи. 

А вот когда тексты сильно упростятся в производстве благодаря нейросетям, тогда мы столкнемся с наводнением интернета кучей текстов. И, в первую очередь, по таким низкочастотным запросам. Т.е. нейросети будут просто высасывать контент из низкочастотных запросов, и требования к качеству таких текстов будут низкими. 

Это будет оправдано, потому что и конкуренция среди таких текстов будет низкая. Сейчас, например, ее вообще почти нет. Есть куча ключей, по которым вообще нет напрямую соответствующих им статей.

Затем по тому же принципу люди продолжат накидывать тексты по различным запросам с помощью нейросетей. И уже тогда конкуренция в выдаче начнется с точки зрения качества текста, а не отработанных ключей. Требования к качеству резко вырастут, когда вся семантика будет забита, и уже тексты начнут конкурировать друг с другом. Тогда все займутся тем, чтобы повышать экспертность сгенерированных текстов. Например, будут улучшать визуальное повествование или отрабатывать технические ошибки на сайтах. 

Но если говорить про отношение к уникальности, то в этом плане нейросети упростят работу. Например, отрерайтить что-то с помощью нейросети будет намного проще и быстрее, чем вручную.

SEO-специалисты Unisender
SEO-специалисты Unisender

Нейросети не повлияют на отношение к уникальности контента. В будущем, скорее всего, авторский контент будет не сильно отличаться от сгенерированного. Особенно, если в процессе генерации будет участвовать копирайтер или редактор.

Где проверить уникальность текста

Перед публикацией уникальность текста можно проверить в специальных сервисах. Рассказываем о самых популярных.

Константин Рудов
Константин Рудов

Главред блога SMMplanner, ведет авторский блог в Telegram

Сервисы проверки уникальности проверяют ее не так, как это делают поисковые системы. У поисковых систем очень сложный алгоритм, а у сервисов по проверке уникальности более простой — сервисы просто ищут определенное количество повторяющихся слов в тексте для проверки и на разных страницах в интернете. Например, сервис проверяет 3 слова подряд, и если в каких-то других статьях есть эти же 3 слова в таком порядке, то он считает это совпадением. 

А поисковики сейчас смотрят на уникальность текста более сложным алгоритмом. Поэтому сервис проверки уникальности может выдать одни значения, а поисковик увидит другие. 

Кроме того, если один и тот же текст проверить на уникальность в разные дни, то сервис проверки выдаст разную уникальность. Дело в том, что сервис сравнивает текст с поисковой выдачей в конкретный день, а она тоже может меняться.

Как рассчитывается уникальность текста

Перед тем, как рассчитать уникальность текста, поисковые системы сначала индексируют новую страницу, сохраняют информацию о ее содержимом, URL-адресе и всех метатегах. После этого они сравнивают контент страницы с другими похожими страницами в интернете. Для этого используют шингловый алгоритм.

Шингловый алгоритм сравнивает специальные фрагменты текста (шинглы) с содержимым других сайтов. Он работает примерно так:

  • Убирает из текста все стоп-слова: знаки препинания, предлоги, частицы, междометия и т. д.
  • Делит отформатированный текст на отрезки определенной величины (шинглы).
  • Выбирает фразы для поиска совпадений в сети.
  • Сравнивает шинглы с найденными страницами. Если находит совпадения — вычитает какой-то процент из 100. 

Advego и Advego Plagiatus

Сайт: https://advego.com/antiplagiat/ 

Это два практически одинаковых сервиса от биржи копирайтинга Advego. Разница в том, что Advego работает в браузере, а Advego Plagiatus нужно устанавливать на компьютер. Также в Advego Plagiatus больше возможностей для настройки — можно задавать размер шингла для проверки (от 1 до 4). И чем ниже его поставить, тем тщательнее будет проверяться текст на антиплагиат. По умолчанию для проверки выставлено значение 4 — такое же используется в браузерной версии.

Как пользоваться сервисами. Покажем на примере браузерной версии. Для проверки нужно зарегистрироваться на бирже Advego. Регистрация стандартная: указываете email-адрес и логин → на почту приходит письмо-подтверждение → переходите по ссылке в письме и задаете пароль. После этого можно проверять тексты.

Проверка уникальности контента в сервисе Advego
Проверяем текст через Advego

Advego проверяет текст по шинглам — так же, как это делают поисковые системы. Кроме того, у него есть дополнительные алгоритмы:

  1. Поиск лексических совпадений. Проверяет схожесть набора терминов и значимых слов.
  2. Проверка псевдоуникализации. Проверяет текст на замену символов и синонимизацию.

После проверки Advego дает две цифры через слеш: Х% / Y%. Х — процент уникального текста (зависит от количества найденных неуникальных фраз), Y — процент оригинального текста (зависит от процента совпадений по отдельным словам). Хороший первый показатель  — от 90%, второй — от 70%.

Сколько стоит. Сервис бесплатный, но проверить в нем можно текст размером до 3000 символов. Чтобы проверить больше, нужно докупать символы. 1 рубль — 830 символов. В приложении Advego Plagiatus все проверки бесплатные, но периодически там будут всплывать капчи. И пока вы их не решите, проверка не продолжится.

Text.ru

Сайт: https://text.ru/antiplagiat 

Сервис проверки уникальности текста от биржи Text.ru. Работает онлайн и без регистрации. Тексты проверяются в порядке живой очереди. Для зарегистрированных пользователей очередь другая, поэтому ждать проверки придется меньше.

При проверке сервис сканирует текст и дает заключение о его уникальности. При этом он умеет вычислять поверхностный рерайт. Хороший показатель проверки — от 90%.

Как пользоваться сервисом. Перейдите на сайт Text.ru в раздел «Проверка уникальности» → «Уникальность текста». Добавьте текст в рабочую область и запустите проверку.

Проверка уникальности контента через алгоритм антиплагиата от Text.ru
Проверяем текст через Text.ru

Кроме проверки скопированного текста в Text.ru можно проверять целый сайт или текст из документа. А можно настроить регулярную проверку и проверку по API. Регулярная проверка будет автоматически проверять заданные вами страницы или документы. Она поможет обнаружить падение уникальности. Удобно, если кто-то украдет ваш контент: вы сразу заметите это из-за падения уникальности и отследите сайт, на котором находится скопированный текст. А потом сможете написать претензию владельцу и потребовать удалить ваш текст.

Сколько стоит. Сервис бесплатный, позволяет проверить до 5000 символов ежедневно. Зарегистрированные пользователи могут проверять до 15 000 знаков в день. Также символы можно докупить отдельно: 200 000 знаков стоят 150 рублей.

Etxt

Сайт: https://www.etxt.ru/antiplagiat/ 

Сервис проверки уникальности текста от биржи копирайтинга Etxt. Работает в браузере и приложении на ПК.

Для анализа текстов сервис тоже использует алгоритм шинглов. В конце проверки выдает заключение в процентах о степени уникальности контента.

Кроме того, в Etxt можно настроить проверку по API, чтобы проверять все материалы на отдельном сервере.

Как пользоваться сервисом. Для этого нужно открыть раздел «Сервисы» → «Проверка уникальности» → вставить текст в рабочую область → «Проверить».

Проверка уникальности контента в Etxt
Проверяем текст через Etxt

Сколько стоит. Без регистрации бесплатно можно проверить текст объемом до 3000 символов. Если зарегистрироваться — 5000 символов. Платные пакеты стоят 1,5 руб за 1000 символов.

Как повысить уникальность контента

Чтобы повысить уникальность текста, нужно удалить или переписать отдельные фразы, предложения. Вот способы, которые помогут поднять уникальность:

  1. Заменяйте слова на синонимы, причастия и деепричастия — на глаголы. Избавляйтесь от модальных глаголов.
  2. Заменяйте прямую речь косвенной или наоборот. 
  3. Объединяйте несколько предложений в одно или, наоборот, разбивайте одно большое на несколько маленьких.
  4. Используйте аббревиатуры или, наоборот, пишите расшифровками.

Важно! Не во всех текстах можно поднять уникальность. Например, в описаниях товара важнее указать технические характеристики, а в статье на юридическую тему — термины, законы и т.д. Поэтому всегда на первое место нужно ставить пользу для читателя, а на второе — уникальность.

Константин Рудов
Константин Рудов

Главред блога SMMplanner, ведет авторский блог в Telegram

У нас был текст по теме продажи недвижимости, правовых документов и правовых актов на этот счет. Когда мы написали статью, она была уникальна на 42%. Мы решили это исправить. 

Переписали статью, добавили в нее больше информации и подключили эксперта. Статья стала полезнее и интереснее, в ней появился целый блок информации, которой больше нигде нет. Вот только уникальность текста после этого стала 32%. 

Почему? А потому что сервисы смотрят на уникальность текста не так, как мы думаем. Мы думаем, что они реально проверяют, откуда текст скопировали. А они проверяют только повторяющиеся слова. Но понятно, что эти слова могут повторяться еще много где, даже если ты их полностью написал из головы. Поэтому уникальность важна, но это не то, вокруг чего нужно водить хороводы, приносить жертвы и все в таком духе.

Что в итоге

  • Уникальность контента — это SEO-понятие. Оно означает оригинальность материалов и их распространенность в интернете.
  • Уникальность контента влияет на отношение поисковиков к сайту и его ранжирование в топе поисковой выдаче. Чем больше уникального контента на сайте, тем лучше к нему будут относиться поисковые системы. 
  • На отношение к сайту и его ранжирование влияет еще и польза размещаемого контента. Новостные сайты могут не делать тексты со 100%-ной уникальностью. Для них важнее разработать удобный сайт и сделать так, чтобы люди активно общались в комментариях, репостили записи и т.д. В этом случае поисковые системы будут считать, что сайт максимально соответствует запросам аудитории, и ранжировать его выше остальных.
  • Если сайт будет публиковать неуникальный контент, его посещаемость и позиции в выдаче снизятся. А со временем его вовсе могут исключить из выдачи.
  • Проверить уникальность текста перед публикацией можно в сервисах Advego, Text.ru, Etxt.
  • Чтобы повысить уникальность текста, нужно удалить или переписать отдельные фразы, предложения.