вторник, 19 марта 2013 г.

Сканированный контент для сайта. За и против


Сканированный контент (или просто скан) – это текст, отсканированный из печатной продукции (книги, журналы, газеты и т. д.). Скан является самым дешевым контентом и продается на некоторых форумах од 1 рубля за 1000 знаков. Его можно получить и самостоятельно, имея сканнер, программу для распознавания текста (ABBYY FineReader), и, непосредственно, печатный источник текста. Но при всей кажущейся простоте получения этого продукта, есть очень много вопросов по поводу его практического использования. Подходит ли скан для наполнения сайта? Законно ли использование сканированного материала? Что нужно знать при поиске скана в сети? Ответы на все эти и другие вопросы читайте в продолжении статьи…


Часть 1. Чужая собственность


Каждый веб-мастер так или иначе сталкивается с проблемой наполнения своего веб-ресурса уникальным контентом, который был бы интересен и полезен для читателя. Некоторые пишут статьи сами, некоторые заказывают рерайт и копирайт на биржах или покупают готовые статьи, написанные копирайтерами. В любом из этих случаев веб-мастер будет являться единственным правообладателем такого уникального контента, и, покупая статью, покупает вместе с ней и право владения.

В свою очередь, покупая сканированный контент, Вы платите только за работу по распознаванию текста, либо распознаете его самостоятельно, но единственным законным правообладателем этого текста все равно остается его автор. Именно поэтому, размещая скан на своем сайте, Вы, по сути, нарушаете авторские права, а, следовательно, должны быть в любой момент готовы к претензиям со стороны законного правообладателя. Будет ли это простая просьба удалить материалы с сайта, либо же дело дойдет до суда – не известно. Но о правовом риске обладателю скана забывать уж точно не стоит.

Часть 2. Скан скану рознь.


В первой части статьи я уже упомянул о том, что текст должен быть прежде всего интересен читателю. Значит, если даже Вы собрались заняться сканированием текстов, для начала нужно найти не просто какую-нибудь бумажку с буквами, а такую книгу или журнал, в которой есть материал, соответствующий предполагаемой тематике. Допустим, такую книгу Вы нашли, и уже приготовились к кропотливой работе по ее  распознаванию, но не спешите. Быть может, до Вас это уже сделал кто-то другой? Узнать это очень просто – проверьте небольшой кусочек текста на уникальность через программу-антиплагиат. Если она равняется нулю, значит данная книга уже была распознана таким же предприимчивым веб-матером как Вы, или хранится в открытом доступе в какой-нибудь онлайн-библиотеке. Отсюда вывод: по-настоящему полезен может быть только полностью уникальный скан, который ранее нигде и никем не публиковался. И, поверьте, найти его не так-то просто.

Часть 3 Особые приметы


Допустим, такую книгу Вы нашли, отсканировали и распознали, но… не спешите радоваться. Прежде чем публиковать такой текст, внимательно к нему присмотритесь и перечитайте. При распознавании ФайнРидер очень часто «путает буквы», принимает за буквы рисунки или бумажные «артефакты», а уж о специальных символах и математических знаках и вовсе не знает. Так что будьте готовы к тому, чтобы найти и исправить в тексте всю нечитаемую «абракадабру», а иначе «спалитесь» и перед читателями, и перед поисковыми машинами. Первые, в принципе, не так критичны, а вот вторые за скан могут наказать очень жестоко – надолго выкинуть сайт из индекса.

Заключение.


Из всего вышесказанного можно сделать вывод: использование сканированного контента на нормальных сайтах (читай: СДЛ) весьма спорно и рискованно. Но тем не менее, в сети можно встретить тысячи сайтов, на которых есть отсканированный материал. Все-таки дешевизна и доступность делают свое «черное» дело, так что бдительным ПС навряд ли удастся вычислить и наказать даже хотя бы половину таких «сканированных» сайтов. Конечно, говносайтов это не касается – на то они и говносайты, что содержать могут все что угодно. Но перед тем, как добавлять скан на свой сайт, не поленитесь последовать нескольким простым советам:

  1. Проверьте скан на уникальность и очистите от нечитаемых и лишних символов – сделайте его как можно более похожим на авторский текст.
  2. По возможности, постарайтесь сделать хотя бы рерайт текста – в этом случае шанс для такого контента оставаться уникальным как можно дольше значительно увеличивается.
  3. Не желательно наполнять сканом сайт больше, чем наполовину. Старайтесь разбавлять такой материал хорошим, авторским контентом.

0 коммент.:

Отправить комментарий