feedburner
Подпишись по e-mail:

test

Авг
24

Выбираем парсер

Автор: Курский бомж | Рубрика Дорвеи, Сателлиты, Сплоги

x_7b9d7a6d copy

Я недавно писал что заинтересовался парсингом контента. Копипаст вроде бы нормально живет в индексе, главное это дизайн и структура самого сайта.

После продолжительных поисков наткнулся на парсер конента под названием X-Parser, который меня сразу заинтересовал. Сейчас расскажу почему… Почти во всех известных и не очень парсерах происходит граббинг контента с одного сайта, например с каталога статей, таким образом у нас будет всего несколько сайтов в виде источника, а это палевно когда половина контента с сайта появляется на другом, да и жутко неудобно…

В X-Parser же есть такая функция как парсинг контента по ключевикам! Вы вбиваете нужные ключевики по тематике вашего сайта, они ищутся в поисковике и программа сама заходит на сайты в выдаче и парсит оттуда статью, причем объем ограничен только глубиной выдачи. Вот это и правда бездонный источник конента… Эта функция незаменима для доров (либ.ру и другие крупные бибилотеки уже по 100 раз все использовали, а тут неограниченное количество контента для дорвеев) и для сателлитов.

Так как изначально я искал парсер для сателлитов, то необходимо было удобство импорта сграбленного в CMS… Сказал об этом автору, и он тут же сделал экспорт контента под формат TextKit, все для клиента как говорится, любые ваши пожелания по функционалу будут учтены. Теперь можно в 2 клика мышки загрузить весь сграбленный контент в любую CMS. Также по-моей просьбе автор сейчас работает над парсингом тематических картинок и распределением их в тексте статей, когда это будет доделано обновления естественно бесплатны.

Но это я описал всего лишь функции которые незаменимы для меня, кроме них в X-Parser еще куча функционала, настоящий комбайн, который умеет:

1. Парсить выдачу любых поисковых систем по ключевым фразам сохраняя сниппеты и ссылки.
2. Парсить контент (текстовый) с любого сайта по заданному домену.
3. Парсить контент (текстовый) по ключевым фразам из выдачи любой ПС.
4. Парсить контент (текстовый) по заданному списку URLов.
5. Парсить внутренние ссылки с любого URLа в частности или сайта в целом.
6. Парсить внешние ссылки с любого URLа в частности или сайта в целом.

parser

Также в комплекте Прокси чекер который сам собирает проски из свободных источников, проверяет их, оставляет рабочие и самые быстрые.

Парсер может работать через прокси и в несколько потоков, что позволяет парсить около 500мб текста в сутки!

Стоимость X-Parser составляет 80$ за весь комплект. Если вы говорите что узнали о нем от меня, то для вас он будет стоить на 10$ дешевле — 70$. Также возможна продажа отдельных модулей, но выгодней конечно будет купить комбайн целиком. На отдельные модули скидка будет 10% если говорите что вы от меня.

Учитывая что парсер постоянно развивается, лучше поспешить пока цена не выросла. Контента в выдаче хватит на всех:)


Ноя
24

Расходы на сплоги. Палю темы!

Автор: Курский бомж | Рубрика Сателлиты, Сплоги

Сделать 30 сплогов под сапу я собрался. А интересно ли вам сколько я собрался потратить на все это??? А почти ничего! 110 рублей :-)

"Почему так мало?, «Каким образом?» — спросите вы. Сейчас расскажу...

Собственно для создания сплога как и любого сателлита необходимы 3 вещи: знания, домен, хостинг. Если первая вещь невещественная, то за 2 остальные нужно платить...

1. Домены

А вот и сама тема со всеми подробностями: Домены org.ua бесплатные и принимаются в сапу без ТИЦа!!!!!

Теперь расскажу про регистрацию.

1) Регистрируем UANIC вот ТУТ.

2) Отправляем на мыло роботу заявку на авторегистрацию в такой форме:

Адрес получателя: register_query@org.ua
Тема письма: ADD вашдомен.org.ua

Кодировка письма KOI8-R

Тело письма:

domain: superdomen.org.ua [имя вашего домена]
descr: super domain [описание домена (любое)]
admin-c: UP99-UANIC [UANIC запись, которую вы уже зарегистрировали в пункте 1]
tech-c: UP99-UANIC  [тоже самое]
nserver: ns1.hosting.ru [dns сервер вашего хостинга]
nserver: ns2.hosting.ru [второй dns сервер хостинга]
changed: i@pupkin.ru 20091124 [ваш email и текущая дата (год месяц день)]
source: UANIC [остается как есть]

Естественно мои замечания в [ ] писать не нужно.

Теперь палю мини тему насчет е-мейлов. В целях защиты от спама там сделано ограничение на регистрацию всего 3-х доменов в день с одного e-mail хостинга(не ящика). Т.е. про бесплатные ящики можно забыть. А выход вот где! :-) Берем любой свой домен, делаем на нем ящик типа admin@domen.ru и с него шлем 3 заявки. Если больше доменов у вас нет, то на только что зареганных доменах org.ua делаем еще ящики и с каждого опять же 3 заявки и так далее, но думаю доменов у вас найдется)).

Как палят. По UANIC естественно, по мылу, поэтому я регил 30 мыл и 30 разных UANIC. И как оказалось совсем недавно то еще и по IP... В общем меня вычислили, итого успел зарегить 18 доменов и больше регить не могу, походу UANIC'и вычислили, или по хостеру хз... Вел переписку с админом, вот что он ответил :-) 🙂

 

Re: Обращаюсь за разъяснением

Я тоже обращаюсь за уточнением: Вы «Сидор Жидов» или «Саша Сумов»?
И действительно ли Вы живете в Киеве на улице Стритовой, 6648?

Ну 30 имен и улиц придумывать у меня мозг устал))))))))))))

Доры и адалт выкидывают сразу, сплоги у людей живут нормально, главное домены с умом регить, чтоб не попалили что это один человек... Индексация кстати вроде хорошая, по 5 страниц с блогов с одной статьей залезло быстро.

2. Хостинг

Вот на хостинг я и потратил те 110 рублей :-) о которых писал выше. Для всех сатов, как и для этих сплогов использую хостинг IPhoster. Почему? Да потому что за 110 рублей в месяц например я купил тариф на 50 сайтов, 5 гигов места, неограниченный траф и неограниченные БД, притом что аптайм для таких супер низких цен нормальный, в сапе ссылки в еррор вылетают бывает, но редко.

Даже табличку в екселе составил чтобы самому подсчитать какой тариф брать выгодней, думаю и вам будет интересно (кликабельно):

ScreenShot052

3. Что дальше

Вот так я почти бесплатно хотел такой эксперимент сделать. Думаю дальше с доменами не возиться (потом разберусь по чем они меня там забанили), а запустить 18 уже почти готовых сплогов, WP стоит, все подготовлено, осталось поставить плагины и запустить граббинг, но сначала дождаться индексации, пока меньше половины проиндексировано. А уже по результатам будет видно что делать дальше :-)

Плохо только что времени сейчас в обрез(( инст напрягает, пока болел пропустил кучу, а терь все хвосты заносить)) Греет душу только то, что план по заработку на этот месяц уже выполнил аж неделю назад, но об этом потом:)


Ноя
15

30 сплогов. Экватор

Автор: Курский бомж | Рубрика Сателлиты, Сплоги

0_4b8_a4006bc2_L

Двигаюсь понемногу к цели А не сделать ли мне… 30 сплогов…

Делаю потихоньку сплоги, несмотря на различные недомогания после болезни :-) И на сегодняшний день готово 15 штук. Но это пока не сплоги, а установленный WordPress с одной рерайченой новостью.

Вхуизы у всех доменов разные, шаблоны на КАЖДЫЙ блог ставлю разные, ну IP только одинаковый у всех, потому что одном хостинге делаю, но там еще очень много сайтов, среди которых и ГСы и СДЛы, так что думаю это не сыграет роли.

Уже сейчас задумываюсь что именно делать после того как доделаю все 30...

Какие есть варианты:

1. На каждый блог добавить еще несколько рерайченых новостей.

Плюсы: Как бы повысится «трастовость», ведь чем больше ручного уникального контента, тем лучше яндекс будет относится.

Минусы: Сплогов 30, а это значит что я з*и*усь рерайтить новости :-) Даже по одной новости на сплог, это 30 новостей в сумме... ппц... Покупать тоже выйдет очень дорого.

2. Запускать грабилку RSS сразу, поставив Unikalizator WordPress Plugin.

Плюсы: Не надо возиться, ставим и блог наполняется контентом автоматически сразу. Новости будут уникализированны, это хорошо, но какое качество уникализации через этот плагин пока не знаю.

Минусы: Текст может получится дерьмовым и Яндекс выкинет сплог...

3. Запускать грабилку RSS сразу, не уникализируя, т.е. тупо копипаст.

Плюсы: Не надо возиться, ставим и блог наполняется контентом автоматически сразу. Новости будет хорошо читаемые, классные, но копипаст :-) Но живут же сайты с копипастом, когда из нескольких мест он тырится...

Минусы: За копипаст яндекс может забанить еще быстрей, чем за уникализированный текст.

 

Вот в общем, пока буду ставить еще 15 сайтов как раз будет время обдумать этот вопрос :-) Пока склоняюсь ко второму пункту. Хотелось бы узнать ваше мнение.


Окт
23

А не сделать ли мне... 30 сплогов...

Автор: Курский бомж | Рубрика Заработок, Сателлиты, Сплоги

Заинтересовала меня тема сплогов. Хорошая штука — не нужен контент, страниц куча под сапу, ежедневные обновления, и у тех кто ими занимается живут нормально даже в сегодняшние тяжелые времена.

И решил делать не 1-2 сплога на пробу как обычно, сразу 30 !!! Провалюсь так провалюсь, но думаю из 30 хоть какая-то часть выживет даже при плохом исходе:) А в идеале все должны выжить конечно)))

В итоге если все будет идеально, и каждый блог будет приносить хотя бы 10р. в день в сапе(а я думаю спокойно и 15-20 может приносить, плюс лиекс еще можно прикрутить), то получу в результате +300р. в день в сапе к своим жалким 40 с чем-то рублям :-) Про плохой исход не хочу думать, но буду к нему готов:) Будет так будет, ведь правилу оптимиста: «Верь в лучшее, но будь готов к худшему» я всегда следую:)

Схема будет такая (предварительная): ставим WP, рерайтим одну новость, ждем индексации, потом рерайтим раз в несколько дней еще несколько новостей и уже потом ставим автонаполнение с уникализацией на лету. Если есть какие-нибудь пожелания, поправки или предложения — с удовольствием выслушаю, так как сплогов я еще ни разу не запускал.

Сделал в экселе такую табличку для мониторинга работы:

Вхуизы у доменов делаю разные, в день буду регистрировать по домена 3, во-первых, чтобы не сразу все в один день, а во-вторых, в день поставить 3 блога на WP и отрерайтить 3 новости не очень напряжно.

В общем удачи мне))) И жду ваших подсказок и пожеланий:)

P.S. я кстати выграл 30$ в конкурсе, который проводил Кемеровский, потому что был единствунным участником)))) так вот люди, не ленитесь, а участвуйте в конкурсках;)