浏览:327 2008-05-26 17:24 来自 【组长】隨風.NET      :

  

很多人误解垂直搜索就是把相关的行业网页做一个采集,进行正文抽取,实现搜索,完成信息册查询。其实并非如此。如果这样无法和网页搜索竞争,网页搜索很容易就可以将网页库按行业分类、按地区分类。

   垂直搜索应该是对垂直行业信息进行深度的加工,有效的整合,为用户提供网页搜索无法做到的专业性、功能性,为用户提供深一步的服务和完整的体验,而且不仅仅是提供信息的检索。垂直搜索是和信息搜索有本质的差异化的。

   这段话是摘录来的,不过我现在看来,spider爬行一个网站,获得html,然后根据这个网站对应的正则获取数据,这个就是类似于采集,不知道大家怎么想的,不过这个 采集要高级一点,spider会自己按url爬行获取数据,不像采集那样要指定url.



收藏 楼主
  6个月前  BogeyHan      :
做行业采集,应该只能指定一些URL,对于这些URL页面的结构也要做相应的数据处理。

有时候想想,如果垂直搜索蕴藏的商机很大,像最有资本做这块的百度、谷歌等,似乎应该早就出手了。百度现在也有针对某一方面的搜索,但并没有做数据加工,像视频搜索、文档搜索等。

持续关注下~~~

1楼 回到顶楼 
  6个月前  阿胜      :

2楼 回到顶楼 
  4个月前  金鱼      :
怎么目前都是理论方法的东东呀! 有没有这方面具体的内容呀?
3楼 回到顶楼 

注册用户登录后才能回复,登录注册
> 返回“垂直搜索研究”


其他话题

相关内容

相关链接
1 15670