KTDictSeg 1.4 版本 已经开发到最后阶段,不日即将推出。先将该版本的功能预告如下:
1、 增加对Asp.net的支持
2、 增加多元分词,即多重冗余分词。
比如:一次性交易,采用多元分词后可以得到 “一次”,“性交易”,“一次性”,“交易这4个词,这样做
将有助于搜索引擎搜索到更多的单词组合。具体的技术会更复杂一些,我将在写一篇博客专门讲述这个
技术。
3、 配置文件中增加对相对路径的支持(winform 和 asp.net)
4、 字典工具增加根据词性和单词长度查找功能。
5、 字典工具增加单词导出功能,用于构件停用词表。
6、 增加ASP.NET 的例子
7、 输出结果中增加词性,权重等信息
8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。