[已解决问题] 蜘蛛爬行程序
提问时间: 2008-06-25 13:17
悬赏分:10 浏览:256 次
大家谁做过蜘蛛爬行程序啊,就是搜索各个网页中的email地址,好像得用到多线程呢,而且还要限制页面的级数,就是搜索到第几层页面,大家帮帮忙,给个思路。。
提问者:小孤狸 - 初学一级
最佳答案
网上有关这个的例子.....下载了看看,是个老外写的,是在csdn上的,具体找找......
2008/6/26 10:05:15 回答者:林间曦阳


提问者对于答案的评价:就这样吧,我找过了,没有适合我的,不过谢谢你们了。。。。
其它回答(4)
你是说用多线程 同时扒 不同DIV里面的 EMAIL吗? 我倒是有个建议,你可以不考虑在哪个 DIV上,直接就开始先扒一天的 EMAIL,然后选择出里面出现个数太多的,那肯定就是网站的 EMAIL或者一些广告的,把他们放在数据库里,然后再添加一个认证模块,只有Email不在这些地址之中的才储存起来,留着干啥都行!(当然如果你想发垃圾邮件当我没说!)。最后你也可以把选取出现次数过多EMAIL的功能继续保留,并且在没次扒取email之后进行选取和添加,这样,就算那些网站换了EAMIL,你也不会放过。
2个月前   回答者:西凡 - 菜鸟二级
我不相信爬人家EMAIL能干出啥好事来
2个月前   回答者:solo - 菜鸟二级
正则表达式嘛
2个月前   回答者:光年 - 菜鸟二级
=。= 我爬过图片 论坛回复的抓贴 不过爬Email不大赞成 论技术也就是正则表达式
2个月前   回答者:小眼睛老鼠 - 小虾三级
评论
   您需要登录以后才能回答!
 

我要提问

我的问题


快到期问题

> 问题排行榜

相关链接