Как уберечь от разворовывания контент на своем сайте: пошаговая инструкция

Воровство в интернете Необходимость защитить тексты на своем сайте от разворовывания у меня появилась полгода назад, когда с одного моего перспективного сайта с минимальными пузомерками стали массово копировать тексты другие сайты. Особенно беспокоил один старый трастовый конкурент с ТИЦ=180 и отличной скоростью индексации украденных у меня материалов. С этим надо было что-то делать, т.к. посещаемость у меня падала, а первоисточником моего контента поисковики считали копипастеров. Поборов лень и запасясь терпением, я начал работу по защите плодов своей работы – и у меня получилось. Делюсь алгоритмом и пошаговой инструкцией того, как я этого добился. Статья большая, в ней нет ничего гениального или секретного, но ее стоит почитать и, возможно, добавить в избранное :).

Обойдемся без вступлений по поводу моральной стороны воровства информации в интернете. Это явление, к сожалению, очень распространено и любой вебмастер с ним не раз сталкивался на практике. Бороться с ворами цивилизованными методами не представляется возможным, техподдержка поисковиков ограничится отпиской «мы зеркало интернета, обращайтесь в милицию». Но бороться с ворами как-то надо. И в этой статье я расскажу, как именно.

Это практическое руководство, эффективность которого проверена лично мной на практике. Рекомендую применять все 10 шагов по защите своего контента от разворовывания, т.к. именно комплексное решение проблемы дает наилучшие результаты.

1. Избавляемся от парсеров, блокируя их IP в .htaccess. Грабберы текстов часто работают автоматически, копируя контент с сайта-донора как только он там появляется. При этом грамотно написанные парсеры либо удаляют все ссылки, либо закрывают их, потому надеяться на «дополнительные естественные ссылки» не стоит. Шаг первый для эффективной защиты своих статей от воров – закрыть доступ их скриптов-парсеров к вашему сайту, прописав запрещающие команды в файл .htaccess или фаервол сервера, если вы имеете к нему доступ.

Код запрета доступа по IP через .htaccess:

Order allow,deny
allow from all
#Запрет с IP 198.22.111.11
deny from 198.22.111.11
#Запрет по маске всех IP из подсети 198.99. (точка нужна)
deny from 198.99.

Естественно, время от времени будут появляться и новые грабберы с новыми IP, но почти все манимейкеры понимают намек с первого раза и переключаются на более легкие незащищенные цели.

2. Добавляем иллюстрацию с водяным знаком. Иллюстрации с водяными знаками нередко копируют вместе с контентом, что помогает читателю определить первоисточник и тем самым снижает авторитет копипастера, которому приходится либо удалять такие картинки, либо оставлять их как есть (если иллюстрации – важная часть статьи, например, графики или скриншоты уроков). Контент без иллюстраций в глазах поисковиков менее качественный, так что в любом случае вы останетесь в выигрыше. Плюс велика вероятность того, что вор, который копирует ваши статьи вручную, поленится заморачиваться и найдет себе источник для копирования попроще. Как сделать картинку с водяным знаком читайте здесь.

3. Внутренняя перелинковка. Общеизвестно, что грамотно расставленные ссылки в тексте не только улучшают позиции в поисковой выдаче, ускорят индексацию новых материалов, но и нередко копируются вместе с текстом и размещаются на сайтах копипастеров, особенно неопытными пользователями в соцсетях. Если вы не будете лениться расставлять ссылки между страницами своего сайта, то также улучшите и поведенческие факторы, и Google PR.

4. Плагин WordPress для вставки произвольного скрытого текста в контент. Похоже по сути на п. 3, но в данном случае в защищаемый от копирования текст могут добавляться не только ссылки, но и любой произвольный текст, скрытый с помощью CSS свойством hidden. Для автоматизации этих действий я использую WordPress-плагин под названием Invitext. К сожалению, официальный сайт автора приказал долго жить, поэтому выкладываю плагин Invitext для скачивания здесь. Распакуйте, скопируйте в папку с плагинами, активируйте и в настройках «Параметры» админки Вордпресса укажите текст, который будет добавляться в защищаемый текст и периодичность повтора (количество символов, не рекомендую ставить меньше 120):

Настройка Invitext

Самый большой риск при использовании скрытого текста – возможные санкции со стороны поисковиков. Но за полгода использования у меня проблем не было, да и судя по отзывам в интернете никто из-за работы плагина Invitext не пострадал. В самом крайнем случае его всегда можно отключить, после чего написать в техподдержку Яндекса, чтоб разбанили :).

Впечатления от практического использования этого плагина отличные. В качестве скрытого текста я использовал домен своего сайта, благодаря чему сначала появилось много ссылок и переходов на сайт из соцсетей (копипастеры не сразу сообразили, что привычный источник стал «проблемным»), потом ссылки начали убирать (помогло разбавление ссылки произвольными символами, что затруднило ворам автозамену), после чего копировать практически перестали – вручную слишком долго и нудно бороться с автоплагином.

Из минусов: не каждому сайту подойдет такой метод защиты (например, не рекомендуется использовать сборнику цитат, текстов песен или уроков по программированию).

5. JavaScript, добавляющий ссылку на вашу страницу при копировании. Есть коды javascript, которые запрещают выделение текста или его копирование. Это неудобные и неправильные решения вопроса защиты текста от разворовывания – честным посетителям сайта это очень не нравится, а ворами легко обходится. Намного лучше добавлять в буфер обмена при копирования статьи или ее фрагмента некий дополнительный текст +ссылку на первоисточник.

JavaScript-код для добавления ссылки вконец скопированного текста:

<!-- ссылка на первоисточник -->
<script type="text/javascript">// < ![CDATA[
// < ![CDATA[
// < ![CDATA[
// < ![CDATA[
// < ![CDATA[
//< ![CDATA[
function addLink() {
    var body_element = document.getElementsByTagName('body')[0];
    var selection = window.getSelection();

    // Вы можете изменить текст в этой строчке
    var pagelink = "

Ссылка на первоисточник: <a href='"
+document.location.href+"'>"+document.location.href+" ";

    var copytext = selection + pagelink;
    var newdiv = document.createElement('div');
    newdiv.style.position = 'absolute';
    newdiv.style.left = '-99999px';
    body_element.appendChild(newdiv);
    newdiv.innerHTML = copytext;
    selection.selectAllChildren(newdiv);
    window.setTimeout( function() {
        body_element.removeChild(newdiv);
    }, 0);
}
document.oncopy = addLink;
// ]]></a></script>
<!-- /ссылка на первоисточник -->

Этот код нужно добавлять перед закрывающим тегом body (в файле header.php в вордпресс-теме). Не помню, где его нашел, но ни у меня, ни у автора кода в браузере Internet Explorer оно почему-то не работало.

6. Сообщаем Яндексу о скором появлении уникального контента. На seo-форумах есть два диаметрально противоположные мнения на счет необходимости добавлять текст еще не опубликованной статьи в аддурилку Яндекса «Оригинальные тексты» в панели вебмастера. Я добавлял, т.к. считаю, что лишним это не будет, а времени занимает сравнительно немного.

Оригинальные тексты Яндекса

7. Сообщаем Google о публикации новой страницы. Опытные вебмастера и сеошники советуют подключать авторство статьи через соцсеть Google+  – и это правильно. На практике я этого не делал – руки не доходили. Вместо этого я сообщал роботу через панель вебмастера о необходимости переиндексировать страницу после ее публикации:

Запрос на переиндексацию в Google

Хуже, чем подтверждение авторства текста, но быстрее, привычнее и тоже работает.

8. Отложенная на ночь публикация новых текстов. Если не лениться и отрубить по IP ботов (см. п.1), которые парсят сайт автоматически в любое время суток, то остаются недобросовестные манимейкеры, которые делают это вручную. Этим нехорошим людям тоже надо спать и делают они это, как правило, ночью. Потому отложенная на ночь (02:00 будет в самый раз) публикация даст время поисковикам проиндексировать статью раньше, чем о ней узнает копипастер, что в долгосрочной перспективе поможет поисковикам правильно определять первоисточник даже если трастовый сайт ворует тексты у новичка без обратной ссылки.

В CMS WordPress запланировать публикацию просто, достаточно указать дату публикации в будущем:

Отложить публикацию в Вордпрессе

9. Покупка дешевых ссылок на защищаемую статью. Существует «секретный» способ показать поисковикам, что статья именно на вашем сайте является первоисточником. Для этого с других сайтов нужно купить 4-8 недорогих ссылок с длинными анкорами, являющимися точными цитатами из вашей статьи (для этих целей также можно завести сеть сателлитов – при серьезном массовом подходе точно окупится). Способ хороший, но подходит для защиты (а параллельно и продвижению по низко- и среднечастотным запросам, наращиванию ТИЦ и PR) больших качественных статьей, т.к. с большим количеством низкокачественных статей возиться долго и дорого. Правда, в этом случае и воровать у вас что-то желающих будет немного.

10. Вставка контекстной рекламы в текст статьи. Помимо того, что по контекстной рекламе внутри текста статьи чаще кликают, так можно параллельно защищать текст от копирования, т.к. на удаление «лишних» ссылок из сворованного текста уходит время.

Выводы: Для того чтобы написать качественную интересную статью, требуется потратить некоторое количество времени, которое, как известно, деньги. Поэтому защищать результаты своей работы от разворовывания нужно и средства, если не лениться, для этого есть. Не обязательно использовать все 10 вышеописанных способов защиты текстов от копирования, но 2-3 из них вряд ли смогут помочь. Все способы защиты контента от разворовывания можно обойти, но делать это настолько сложно и долго, что желающих будет очень мало – ведь есть много других, никак не защищенных, сайтов с хорошим контентом, который можно скопировать, выдать за свой и быстро получить прибыль.

4 комментария к «Как уберечь от разворовывания контент на своем сайте: пошаговая инструкция»

  1. Сообщать Яндексу о новых текста лишнее, это не работает, проверено не раз. А в остальном нормально написано новичкам почитать стоит.

  2. хорошая статья, никто не спорит
    но как же лень этим всем заниматься… пусть воруют и подавятся )))

  3. плагин Invitext тоже использую, согласен с автором что не банят за него и ссылки с соцсетей он прибавляет. Если сайт популярный и хомячкам из вконтакте интересный, то они обязательно будут таскать с него статьи, а вместе с этими статьями и скрытые ссылки на сайт

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *