浏览:1255 2008-09-04 23:14 来自 陈光喜      :

最近在做lucene的增量索引,主要是数据实时采集时对索引文件相应的进行增量,原来的索引文件有600M多,在做增量时索引文件也在实时增加,但是查询不到新增加的信息,这个可能是信息没有写入到索引文件,但是为什么索引文件会变化呢,同时增量索引文件会变得跟原来大一倍多。(本人在本机上测试已通过,可以查询到实时增量的索引,但是发布到外网就不行,这里认识是增量索引文件添加失败,但是通过线程队列控制会流失一小部分数据信息)

做过增量索引的朋友进来说下经验,欢迎你的加入!!!

 

收藏 楼主
  10个月前 【组长】 Birdshover      :
Lucene的硬盘存储是以内存存储作为缓冲往进写入的。如果不调用Flash,Optimize或者Close,需要等到内存缓冲的文档数量到你设置的最大数量才会往硬盘写入。而硬盘上的文件,如果正在进行读取操作,因为文件被保护的关系,正在访问的文件不会被释放掉,就会出现两个版本文件共存的问题,占用硬盘就会变成2倍。
1楼 回到顶楼 

注册用户登录后才能回复,登录注册
> 返回“Lucene”


其他话题

相关内容

相关链接
1 36822