浏览:4322008-03-28 08:44   来自雨中漫步的太阳      :

http://www.cnblogs.com/suyuan/archive/2008/03/25/1120827.html

具体可以看这样,希望从讨论中得到长进

楼主
  1个月前   BirdsHover      :
感觉还可以
回复  1楼 回到顶楼 
  1个月前   雨中漫步的太阳      :
今天我使用504800条数据进行测试,制作索引的时间为30分钟,索引数据库中的两个字段.然后进行搜索测试,发现速度非常慢
回复  2楼 回到顶楼 
  1个月前   eaglet      :
搜索速度慢是由于KTDictSeg 分词器引起的吗?我理解用Lucene进行搜索时只是使用分词器对要搜索的句子进行分词,这个过程我觉得不会太慢。如果分词器效率低,影响最大的应该是建立索引的效率。
另外我今天在博客园建立了一个搜索引擎的讨论小组,欢迎加入。
http://space.cnblogs.com/group/search/
回复  3楼 回到顶楼 
  1个月前   雨中漫步的太阳      :
哦 那天是我的测试有点问题,后来发现速度还是可以的
回复  4楼 回到顶楼 
  4周前   shenjk      :
测试了一个上午,建索引速度还可以。可是搜索结果确不理想。Analyzer analyzer = new Lucene.Net.Analysis.KTDAnalyzer.KTDictSegAnalyzer(); string[] fields = new string[] { "Name", "Intro" };
BooleanClause.Occur[] flags=new BooleanClause.Occur[]{BooleanClause.Occur.SHOULD,BooleanClause.Occur.SHOULD};
Query query= MultiFieldQueryParser.Parse(Request["Keyword"], fields, flags, analyzer);Hits hits = searcher.Search(query); 比如:搜索“浙江”有数据;“浙江杭州公司”无结果,是不是在搜索的时候还需要自己去分词?
回复  5楼 回到顶楼 
  4周前   雨中漫步的太阳      :
当然要分词啊, 因为你在做索引的时候 已经将浙江 杭州 公司 作为三个词条存入了索引文件中 而你现在的这个搜索方式 是将 浙江杭州公司 当成一个词条进行搜索 当然搜索不到了
你可以使用lucene里面QueryParser方式进行搜索,在搜索的时候加载分词器
回复  6楼 回到顶楼 
  4周前   shenjk      :
明白了,多谢
回复  7楼 回到顶楼 

你还不是小组成员,加入小组以后才能发布新主题!
> 返回“Lucene.Net”


其他话题

1 29044