Поиск по сорцам html-страниц в .RU-зоне
Потребовалось мне произвести поиск по сорцам html страниц в RU-зоне. Т.к. места на диске для того, чтобы сохранить все страницы в зоне RU у меня нет, то поиск будет производиться без сохранения и только по главным. Естественно, чтобы сделать повторный поиск, надо будет перелопатить все страницы снова. Поэтому у меня к вам предложение. Я все равно буду искать определенную последовательность символов, поэтому могу сделать это и для вас.
Чтобы получить выборку по сорцам, в комментах к этому посту указывайте кусок фразы или регулярное выражение. После того как поиск будет закончен (а на это уйдет примерно неделя-две), вы получите список хостов со своей фразой внутри. Бесплатно. Запуск паука будет через 3 дня. Поэтому у вас есть ровно три дня чтобы подумать.
Если кто-то подумает из этого сделать сервис, то спешу вас разочаровать, не тратьте свои силы. Потому что все равно я буду время от времени устраивать такие бесплатные акции.
Комментарии: 8:
Вот это :)
google_ad_client = "pub-.*
тебе на http://alpha.spyonweb.com/
К тому же список сайтов на которых есть эта фраза тебе ничего не даст. А я даю только список сайтов.
И эти регэкспы :)
letitbit\.net/download
upload\.com\.ua/get
\.mp3\"
\.ogg\"
\.avi\"
=> selevan@gmail.com
Для буржнета есть http://publicwww.com/
делал коллега
oof.wowizh.ru
installs.in
Давно хотел такой сервис сделать, уже шаблон сделал к ZennoPoster, даже тестовый прогон делал.... все руки не доходят закончить. А почему неделя-две, почему так долго? У меня 2-е суток уйдет примерно на домашнем компе с домашним интернетом... Страниц на гигов 200-300 будет.
И еще.. вот русская база 2 миллиона сайтов, а есть у кого-нибудь актуальная база .com?
Автор, который просил installs.in, напиши на емайл. Кое-что нашлось уже.
Отправить комментарий
Подпишитесь на каналы Комментарии к сообщению [Atom]
<< Главная страница