极速分词:又快又好的中文分词引擎
中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。
经过连续多届国际中文分词评测,由字构词的分词方法获得了压倒性优势,极速分词采用由字构词技术路线,同时优化了分词速度,使得极速分词引擎具备了分词速度快和分词精度高的双重优势。
免费版性能指标
分词速度:350万字每秒,该速度远远超过目前利用模型(如马尔科夫模型)进行分词的速度
分词精度:免费版仅仅使用200万字语料训练分词知识库,分词精度在95%左右,测试表明在保持速度的同时,可以通过增加训练语料规模,将性能提高到97%以上
测试环境:Intel 3GHZ CPU & 2G 内存
当前免费版仅仅包含基本分词功能,后续将继续推出免费的词性标注、关键词识别、新词识别;同时支持用户词典,任何问题和建议,可通过如下方式与作者联系