地址匹配效果

背景
jieba分词是对中文分词这块效果比较理想的,而且有现成的分词器可以供全文检索引擎调用
LTP分词也是对中文分词这块效果比较理想的,在某些方便效果更佳,目前还没有现成的分词器可以供全文检索引擎调用,所以是不是可以将LTP分词后的分词数据给jieba分词引擎补充自定义分词库来用呢
该博客介绍了如何结合jieba分词器和whoosh全文检索库,通过LTP分词引擎预处理地址数据,创建索引,并进行地址匹配。文章包含源码分析和匹配结果讨论,探讨了门牌号匹配错误的问题。

jieba分词是对中文分词这块效果比较理想的,而且有现成的分词器可以供全文检索引擎调用
LTP分词也是对中文分词这块效果比较理想的,在某些方便效果更佳,目前还没有现成的分词器可以供全文检索引擎调用,所以是不是可以将LTP分词后的分词数据给jieba分词引擎补充自定义分词库来用呢
826
350
2686

被折叠的 条评论
为什么被折叠?