Jcseg[dʒɛ'ke'sɛ]是使用Java开发的一个轻量级中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-5.1.0(发布时我发现5.2.0又发布了 ),solr-5.1.0,elasticsearch-1.5.2的分词接口. Jcseg-1.9.6: 1. mmseg过滤器的lazyInitRace bug修复。 2. 同义词&拼音的高亮显示bug修复。 3. detect模式增加位置返回和部分bug修复。 4. 词库词性补全(绝大部分常用词条的词性已经全部补全)。 5. 增加对最新版本的lucene(5.1.0), solr(5.1.0), elasticsearch(1.5.2)的支持。 6. 词库autoload多目录支持bug修复。 7. 合并jcseg-solr到jcseg-analyzer模块了,研究lucene analysis接口变化情况时发现其实他们应该合在一起。 git项目中直接托管了最新的jar包,直接到git下载即可。 上一个版本发布是去年8月份,有很多网友邮件问道是不是不再更新了,只是现在空余时间比较少,进度慢了。 感谢大家的支持与关注! Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持下载地址