четверг, 28 февраля 2013 г.

Самая точная проверка текста на уникальность


На написание этой статьи меня натолкнуло одно очень распространенное заблуждение. Когда я только начинал делать свои первые шаги на бирже копирайтинга, я был уверен, что все сервисы (как работающие в режиме онлайн, так и самостоятельные программы) используют для проверки уникальности текста одинаковые алгоритмы и, соответственно, дают одинаковые результаты. А отличаются они друг от друга только гибкостью настройки и удобством использования. Однако это не так. Проверяя тексты разными способами можно получить результаты, иногда даже сильно отличающиеся друг от друга. Как же тогда узнать самую точную уникальность текста?

Метод шинглов
Да, есть программы действительно очень похожие друг на друга. Например, проверка текста с помощью advego-антиплагиат и etxt-антиплагиат  у меня всегда давала приблизительно одинкавые цифры. Это действительно объясняется схожестью алгоритма. В основе этих двух программ заложен принцип шинглов, или набора слов. То есть, текст разбивается на шинглы состоящие из нескольких слов, и каждый из них проверяется программой в поисковых системах. Количество слов, или длина шингла, определяется пользователем. Программа находит через поисковики совпадения шинглов и выдает результат в процентном соотношении.

Синонимайз
Такой принцип кажется вполне логичным – чем меньше словосочетаний повторяются – тем лучше. Но с другой стороны, выходит, что если в скопированном тексте заменить часть слов на синонимы, а оставшиеся слова поменять местами, нарушив порядок слов в предложении, но, не нарушая лексических связей, можно на выходе получить 100% уникальный текст. На этом, кстати, основано понятие синонимайзинга – самого низкосортного рерайтинга. В интернете, если покопаться, можно найти даже специальные программы, позволяющие с помощью синонимайзинга «размножить» один текст на несколько уникальных.

Естественно, человек грамотный сразу увидит в синонимизированном тексте «неладное». А как к таким текстам относятся поисковые системы? На этот счет мне встречались самые противоречивые мнения, но ясно одно – если текст пишется для людей, а не для поисковых машин, то синонимайз в этом случае будет противопоказан.

Точная проверка
А как тогда быть заказчику на бирже статей, которому недобросовестные исполнители пытаются подсунуть «уникальный» синонимайз? Я бы советовал воспользоваться очень интересным онлайн-сервисом text.ru. Принцип его работы заключается в поиске совпадения слов по всему объему текста без разбивки на шинглы. То есть, проводя проверку текста где, к примеру, просто переставлены слова, Вы увидите совпадения всех одинаковых слов, а их будет очень много. На мой взгляд, такая проверка дает более точный результат. Поверьте мне как копирайтеру – для того, чтобы добиться 100% уникальности рерайта по текст.ру, не нарушая смысла изложения, нужно очень постараться!

Вывод
В заключении хочется добавить к вышесказанному следующее. Проверяя текст с помощью антиплагиаторов, помните главное: уникальность – это всего лишь цифра. Рерайт – вещь довольно специфическая. Есть такие понятия в тексте, которые рерайтер изменить не может – например, цитаты, термины, имена собственные и т.д. Поэтому как бы ни старался исполнитель, получить 100% уникальный текст не всегда получится. Но если для Вас уникальность текста имеет решающее значение, то лучше для проверки использовать несколько сервисов, основанных на разных алгоритмах. Такая всесторонняя проверка будет самой точной и отобразит реальное качество рерайта.

И еще. Не забывайте, что поисковая выдача и алгоритмы поиска могут меняться каждый день, даже по нескольку раз. Так что, проверяя уникальность текста, например, утром Вы можете получить одну цифру, а вечерняя проверка покажет уже другую. Не удивляйтесь, это вполне нормально. 

2 коммент.:

Анонимный комментирует...

Верно

Unknown комментирует...
Этот комментарий был удален администратором блога.

Отправить комментарий