Я недавно писал что заинтересовался парсингом контента. Копипаст вроде бы нормально живет в индексе, главное это дизайн и структура самого сайта.
После продолжительных поисков наткнулся на парсер конента под названием X-Parser, который меня сразу заинтересовал. Сейчас расскажу почему… Почти во всех известных и не очень парсерах происходит граббинг контента с одного сайта, например с каталога статей, таким образом у нас будет всего несколько сайтов в виде источника, а это палевно когда половина контента с сайта появляется на другом, да и жутко неудобно…
В X-Parser же есть такая функция как парсинг контента по ключевикам! Вы вбиваете нужные ключевики по тематике вашего сайта, они ищутся в поисковике и программа сама заходит на сайты в выдаче и парсит оттуда статью, причем объем ограничен только глубиной выдачи. Вот это и правда бездонный источник конента… Эта функция незаменима для доров (либ.ру и другие крупные бибилотеки уже по 100 раз все использовали, а тут неограниченное количество контента для дорвеев) и для сателлитов.
Так как изначально я искал парсер для сателлитов, то необходимо было удобство импорта сграбленного в CMS… Сказал об этом автору, и он тут же сделал экспорт контента под формат TextKit, все для клиента как говорится, любые ваши пожелания по функционалу будут учтены. Теперь можно в 2 клика мышки загрузить весь сграбленный контент в любую CMS. Также по-моей просьбе автор сейчас работает над парсингом тематических картинок и распределением их в тексте статей, когда это будет доделано обновления естественно бесплатны.
Но это я описал всего лишь функции которые незаменимы для меня, кроме них в X-Parser еще куча функционала, настоящий комбайн, который умеет:
1. Парсить выдачу любых поисковых систем по ключевым фразам сохраняя сниппеты и ссылки.
2. Парсить контент (текстовый) с любого сайта по заданному домену.
3. Парсить контент (текстовый) по ключевым фразам из выдачи любой ПС.
4. Парсить контент (текстовый) по заданному списку URLов.
5. Парсить внутренние ссылки с любого URLа в частности или сайта в целом.
6. Парсить внешние ссылки с любого URLа в частности или сайта в целом.
Также в комплекте Прокси чекер который сам собирает проски из свободных источников, проверяет их, оставляет рабочие и самые быстрые.
Парсер может работать через прокси и в несколько потоков, что позволяет парсить около 500мб текста в сутки!
Учитывая что парсер постоянно развивается, лучше поспешить пока
Новая система linktolink.ru — это бесплатный обмен ссылками и статьями. Самое то для новичков, которые только приступают к раскрутке блога. Не нужно никаких затрат.
Похожие статьи:
- Ответ Платона на последний АГС Из сайтов, которые покосило 1-3 апреля у меня только один...
- Мой первый Ап тиц Сегодня был Ап ТИЦа, которого все ждали 2 месяца:) Я...
- АГС – новая волна АП прошел вообще ппц Судя по панике на серче у...
- Внутренняя оптимизация сайта, Азы SEO О SEO оптимизации начал читать и интересоваться совсем недавно, потому...
- Невозвращенцы Выпавшие саты не хотят возвращаться:( В аддурилку заново добавились, но...
Авг 24, 2010 at 11:11:47
80 баксов! Ничего себе! А я сам парсеры пишу, правда под каждый сайт приходится парсер заново писать, но и подумываю над универсальным парсером типа этого. Только пока не соображу, как он будет искать статьи среди сайдбаров, футеров и прочих элементов...
[Reply]
Курский бомж Reply:
августа 24, 2010 at 12:15 пп
Парсеров под один сайт куча, причем универсальных и легко настраиваемых под любой сайт, а вот таких почти нету.
[Reply]
Курский бомж Reply:
августа 24, 2010 at 12:24 пп
Он ищет непрерывные блоки текста больше определенной длинны (задается), так что с этим значением еще нужно поиграться, если поставить маленькое то может как раз таки хватать текст из других элементов сайта.
[Reply]
Авг 24, 2010 at 11:19:37
А парсер картинок зачем там? В текстките разве нету парсера? А вообще неплохая прога судя по описанию. Тоже ищу парсер контента. Слышал Content Downloader неплохой и стоит дешевле.
[Reply]
Курский бомж Reply:
августа 24, 2010 at 12:20 пп
Я тексткитом бесплатным пользуюсь, мне хватает... А в платном есть парсер картинок??
Из описания Content Downloader «Программа загружает статьи по прямым ссылкам на них.» Найди сначала все статьи, собери ссылки на них, а потом парсинг... А тут задал ключевики и вперед.
[Reply]
августа 24, 2010 at 12:34 пп
Спутал с зеброидом. В нем есть парсер картинок.
[Reply]
Авг 26, 2010 at 13:44:55
Использую самый примитивный бесплатный парсер. Сайту больше года 20 000 страниц в индексе, 50 тиц, продано 30% ссылок. В интернете покупать любой продукт — большая глупость, всегда можно найти альтернативу. ИМХО
[Reply]
Мар 2, 2011 at 14:21:23
У кого своего ума нет, — тот ворует контент (поговорка на конкурс #seoidiom).
[Reply]
Курский бомж Reply:
марта 5, 2011 at 9:56 пп
Парсить контент можно не только для воровства, а для последующего рерайта например
[Reply]