Архив

Публикации с меткой ‘хрумер’

Уменьшаем вероятность абуз при постинге

Описанная идея и ее реализация появилась еще во времена конкурсов на 4seo.biz. Однако в то время руки как-то так и не дошли. Зато есть повод описать использование моей идеи применительно к хрумеру.

Чем сможет помочь использование этой идеи?

Поможет удалить из Вашей базы потенциальных абузеров и хорошие модерируемые ресурсы. Это, в свою очередь, избавит Вас от серьезных абузеров и действий людей, которые будут отправлять Ваши ресурсы в Гугл для удаления из индекса, или начинать ДДОСить фиды (мне один раз попался такой красавчег).

Переходим к делу.

На входе у нас есть свеженапаршенная Hrefer’ом база. Далее по пунктам.

0. (не обязательный, можно попробовать и с ним, и без него). Проходим один раз по базе, оставляя ссылку на какой-нибудь ресурс (можно и на свой дор). Этот пункт желателен для увеличения отдачи от пункта 2.

1. Устанавливаем скрипт сбора абузных ресурсов. Размещать скрипт лучше на любом фришнике, поддерживающим php; найти такой в гугле особых проблем не составит. Вот пример скрипта, который нужно будет сохранить под именем “index.php”, и залить на тот фришник, который Вы нашли:

<?

if ($_POST['remove_url']==”")
{
echo ‘<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”
“http://www.w3.org/TR/html4/loose.dtd”>
<html>
<head>
<title>Stop Spam Service</title>
</head>
<body>
<form name=”form1″ method=”post” action=”" >
<p>Please, type URL address of you resource here. It will be immediately removed from our list.</p>
<p>
<input type=”text” name=”remove_url” size=”70″>
<input type=”submit” name=”Submit” value=”Remove”>
</p>
</form>
</body>
</html>
‘;
}
else
{
$t=parse_url($_POST[remove_url]);
$fp = fopen(’urls.txt’, ‘a+’);
fwrite($fp, str_replace(’www.’, ”, $t['host']).”\n”);
fclose($fp);

echo (”Thanks! You’ll no longer receive messages with advertising from us!”);
}
?>

Также в папку со скриптом закачайте файл urls.txt, и присвойте ему права доступа 777. В итоге, при заходе на фришник владельцев ресурса, они увидят приблизительно такую формочку:

Если Вы работаете с русскоязычными ресурсами, напишите текст с таким смыслом:

“Пожалуйста, укажите адрес Вашего сайта, и он будет немедленно удален из списка ресурсов, которые хотят получать рекламные объявления и новости других сайтов.”

2. Нам необходимо составить сообщение, которое мы разошлем по нашей базе. Приблизительное содержание сообщения: “Здравствуйте. Адрес Вашего сайта был найден в публичном списке ресурсов, которые хотели бы получать рекламные объявления. Если Вы НЕ желаете, чтобы мы размещали на Вашем сайте рекламные объявления, пожалуйста, перейдите на сайт http://мойфришник.com, где Вы сможете легко удалить свой сайт из списка.”

Внимание! Ни в коем случае не составляйте объявление и проект в хрумере так, чтобы они содержали активную ссылку на ваш фришник со скриптом - в таком случае фришник могут снести в течение нескольких дней из-за абуз. В проекте для хремера оставьте пустым поле URL. Я не ставлю активной ссылки, и мой скрипт нормально работает на фришнике уже больше полугода.

3. Рассылаем сообщение по нашей базе ресурсов.

4. Через несколько дней заходим заходим по ftp на фрихост, на котором работает скрипт из пункта 1 (ну или через администраторскую панель, если фрихост не предоставляет досутп к сайту по ftp), и добавляем все собравшиеся в файле urls.txt ресурсы в файл xblack.txt, который лежит в папке с хрумером.

5. У хрумера есть 2 инструмента, которые доступны даже пользователям, не купившим программу - это “Удалить повторные ссылки” и “Удалить все файлы по black-листу”. Их можно найти в выпадающем мнею “Инструменты”.

С помощью инструмента “Удалить повторные ссылки” мы уникализируем наш файл xblack.txt. Далее нажимаем “Удалить все файлы по black-листу”, и выбираем базу, которую будем фильтровать от ресурсов, содержащихся в xblack.txt. Ждем окончания процесса фильтрации.

6. Копируем файл xblack.txt из папки с хрумером в папку с хрефером, чтобы потенциальные абузные ресурсы фильтровались еще при парсинге. Теперь Вам останется только повторять пукнты 0-6 с каждым обновлением своей базы ресурсов (хотя можно и немного почаще).

Успехов!

Связанные записи

О спамилках

18 января 2008 Комментариев нет

Понимаю, что тема уже для многих не актуальна, но может кому-то и пригодится. Сам в ближайшем будущем планирую отказаться от спама, а пока,  краткий обзор спамилок.

1. SpamIt B. Как-то давно купил по рекомендации Soul’a. Так до сих пор и использую. Успел написать под нее софт, чтобы упростить и автоматизировать работу, так что если б и переходил на другую, то этот переход должен был быть очень обоснован. Совсем недавно вышло обновление спам-движка.

Плюсы программы:

  • возможность запуска из консоли, возможность полной автоматизации работы.
  • достаточно неплохой пробив
  • спам с проверкой на наличие ссылки
  • встроенные парсеры  гугла, яхи и мсн. Сам ими не пользуюсь.

Минусы программы:

  •  программа практически не обновляется, по пожеланиям пользователей не дописывается.
  • у некоторых проблема с вылетанием программы. Хотя я не один день разбирался с этой проблемой, и теперь эта проблема меня не касается :-)
  • слабенький суппорт
  • привязка программы к серверам разработчиков. Иногда эти сервера ложаться, и спамилка перестает запускаться, из-за чего сервера простаивают. Бывает такое раз в несколько месяцев.

2. SpamIt  Vista.

Пользовался программой достаточно давно, поэтому актуальной информации о ней нету. В то время, когда пользовался, раздражало то, что потоки между собой не синхронизировались, и приходилось долго ждать, пока какой-нибудь один поток закончит свою работу. Работала не всегда стабильно. Плюсом перед SpamIt B был чекер баз, который пробегался по всем ссылкам в базе и искал форму. Насколько я знаю, этот плюс так и остался.

3. Хрумер. Пару дней назад наконец-то была выпущена достаточно стабильная, и без явных глюков, четвертая версия. Самый главный ее плюс  - возможность спама в форумы с капчей.  Минус - сложность интеграции со своими программами для автоматизации работы. Также программа недешева - на момент написания этой статьи стоила 450$. При покупке учитывайте, что запущена она может быть только на 2 компьютерах одновременно.

4. A-Poster. Про эту спамилку я знаю меньше всего. Сам ей не пользовался, но в свое время активно искал инфу про нее. Отзывы о ней почти все хорошие. Хорошо интегрируется со своим софтом, распознает некоторые простые капчи. Думал даже перейти на нее, из-за того что движок Spam It b не обновлялся. Но движок неожиданно обновили в начале 2008 года, и я передумал. Лучше направлю свои силы и время в проекты, не требующие спама.

На этом сегодня заканчиваю. В следующем посте - обзор парсеров.

Связанные записи