Главная > Софт > О парсерах

О парсерах

Как и обещал в предыдущем посте, расскажу тут про парсеры поисковиков

1. Парсер SpamIt B!. В спамилке SpamIt B! есть 3 встроенных парсера поисковиков - для гугла, яхи и мсн. Сами парсеры неплохие, свою задачу выполняют, но не более. Никаких автоподстановок зон, никакого автосохранения результатов в файл (кроме парсера гугла). Во многом из-за этого и отказался от этих встроенных парсеров. Очень нервирует, когда софт работает несколько дней, а потом вылетает, не сохранив никаких результатов.

2. Hrefer. Этот парсер - бесплатное приложение к спамилке Hrumer. Хотя по-моему парсер можно купить и отдельно. Лишен основных недостатков предыдущего парсера. Единственные недоработки - нету возможности перебора языков, и несколько непродуманная и негибкая работа с проксями.

3. Xkovator. Отличный парсер. Обладает самыми гибки настройками, возможность перебора языков, подстановки уточняющих слов и доменных зон, более-менее продуманной работой с проксями. Единственное, что не нравится - ожидал бОльшего от режима “SmartParsing”, когда программа сама решает, нужно ли подставлять дополнительные признаки или нет на основе количества результатов поиска. Разработчик уже несколько месяцев обещает через месяц выпустить новую версию, где будет многое улучшено, но никаких результатов этих обещаний пока нету. Подробнее о программе можно прочитать на ее сайте - http://xkovator.com/. Стоимость парсера гугла на 1 год - 50$.

Есть еще несколько парсеров, например Aura второй версии. Но сам ей не пользовался, поэтому ничего писать не буду.

Жаль, что до сих пор нету  комплексного решения для парсинга того же гугла. Чтобы я дал на вход список запросов, а на выходе получил список страниц с формой.  И скорее всего уже и не появится, ибо время когда можно было на этом хорошо заработать почти ушло. А жаль.

Связанные записи

  1. 19 Февраль 2008 в 13:27 | #1

    Парсер не стоит покупать, имхо. Его можно:
    а) Написать самому
    б) Дописать самому

    Я предлагаю второе: http://www.cglc.org/?p=10

  2. admin
    19 Февраль 2008 в 21:39 | #2

    Если надо отпарсить пару ключевых слов, или немного данных - согласен.

    Однако когда надо парсить много и качественно - продукт, написанный на коленке, не подходит.

  3. 1 Апрель 2008 в 09:52 | #3

    Так напиши не на коленке :)

  1. Пока что нет уведомлений.