甲言是专门用于古汉语处理的一款NLP工具包,可以直接用于词库构建、分词、词性标注、断句、标点等,github上也有训练好的模型可以直接使用。
首先上结果:
Jiayan链接:
https://github.com/arahan99/Jiayan
在安装的过程中主要遇到的问题是Kenlm的安装:
试过多种解决方法,最后走通的是下面这一个:
https://zhuanlan.zhihu.com/p/465324025
采取的方法是:安装anaconda+安装visual studio installers+离线装包