pyltp 是 LTP 的 Python 封装,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。
使用前请先下载完整模型
请先下载完整的 LTP 模型文件
-
下载地址:百度云 7G+大小
-
当前模型版本 - 3.4.0
-
请确保下载的模型版本与当前版本的 pyltp 对应,否则会导致程序无法正确加载模型。
-
放到任意方便调用的地方即可, 因为程序里需要你自己主动调用的。
请注意编码
pyltp 的所有输入的分析文本和输出的结果的编码均为 UTF-8。
如果您以非 UTF-8 编码的文本输入进行分析,结果可能为空。请注意源代码文件的默认编码。
由于 Windows 终端采用 GBK 编码显示,直接输出 pyltp 的分析结果会在终端显示为乱码。您可以将标准输出重定向到文件,以 UTF8 方式查看文件,就可以解决显示乱码的问题。