浏览:275 2008-10-02 07:31 来自 【组长】eaglet      :

KTDictSeg 1.4 版本 已经开发到最后阶段,不日即将推出。先将该版本的功能预告如下:

 1、 增加对Asp.net的支持
 2、 增加多元分词,即多重冗余分词。

比如:一次性交易,采用多元分词后可以得到 “一次”,“性交易”,“一次性”,“交易这4个词,这样做

将有助于搜索引擎搜索到更多的单词组合。具体的技术会更复杂一些,我将在写一篇博客专门讲述这个

技术。

 3、 配置文件中增加对相对路径的支持(winform 和 asp.net)
 4、 字典工具增加根据词性和单词长度查找功能。
 5、 字典工具增加单词导出功能,用于构件停用词表。
 6、 增加ASP.NET 的例子
 7、 输出结果中增加词性,权重等信息

 8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。

收藏 楼主
  2个月前  不必      :
哇.好样...期待中...
1楼 回到顶楼 
  2个月前  不必      :
二楼也不能放过.哇卡卡.
2楼 回到顶楼 
  2个月前  Doho      :
支持楼主
3楼 回到顶楼 
  1个月前  kevin002      :
严重支持楼主
4楼 回到顶楼 
  1个月前  Jon.Hong      :
请问楼主支不支这样的分词

北京大学---- 北京-大学-北大
5楼 回到顶楼 
  1个月前 【组长】 eaglet      :
同义词识别,后续版本将考虑加入
6楼 回到顶楼 
  1个月前  平静中的疯狂      :
7楼 回到顶楼 

注册用户登录后才能回复,登录注册
> 返回“搜索引擎”


其他话题

相关内容

相关链接
1 22856