Проверка текста на уникальность
Сегодня напишу о том, что такое уникальный контент, в чем его особенность и как определять уникальность контента. Итак, приступим!
Что такое уникальный контент? Уникальный контент, это контент не встречающийся ни где больше, кроме как на вашем сайте. То есть Ваш экземпляр, например статьи, не имеет копий – он такой единственный и неповторимый:)
В чем особенность уникального контента? С недавнего времени поисковые системы стали, плохо индексировать копированный контент, точнее сказать они перестали вообще индексировать сайты с ворованным контентом. Это с одной стороны правильно, ведь ситуация сложилась так, что зачастую посетишь пару десятков сайтов (когда ищешь ответ на какой либо вопрос), а содержание всех этих сайтов одинаковое. Это глупо, кроме того, самим поисковым системам невыгодно держать у себя в базе копии страниц сайтов. Ведь если добавлять в базу только уникальный контент, а копии игнорировать, то можно очень значительно уменьшить объем хранимых данных, и уменьшить нагрузку на сервера поисковых систем.
Для проверки контента на уникальность в сети существует большое количество сервисов, можете поискать. Я могу предложить лишь воспользоваться сервисом , на мой взгляд, отличный сайт, вроде бы справляется со своими обязанностями! Кроме того, можно воспользоваться простым дедовским способом проверки текста на уникальность. Он заключается в следующем: берем с текста любые две/три строчки текста, забиваем их в поиск Яндекса, и если он ничего не нашел, то контент уникальный! Вот и всё!
11 Дек 2009 в 0:58
“берем с текста любые две/три строчки текста, забиваем их в поиск Яндекса, и если он ничего не нашел, то контент уникальный! Вот и всё!” Хммм. Так можно найти полностью идентичный текст. А если в тексте изменены или просто выброшены несколько строчек? Можем получить отличную от нуля, но чрезвычайно низкую уникальность. Не вариант.
08 Янв 2010 в 16:36
Да, а ведь написано действительно хорошо..