github
这是百度开源的一个词法分析工具
首先要安装paddlepaddle
pip install paddlepaddle
pip install paddlehub
PaddleHub 是基于 PaddlePaddle 开发的预训练模型管理工具,可以借助预训练模型更便捷地开展迁移学习工作,旨在让 PaddlePaddle 生态下的开发者更便捷体验到大规模预训练模型的价值。
它可以帮助我们下载和使用一个Lac的模型
首先将待处理文本分句换行处理好
上代码
# 导入paddlehub
import paddlehub as hub
# import tqdm
if __name__ == "__main__":
# 加载名为lac的预训练模型
textlist = list()
with open('./nerOriginal.txt', 'r', encoding='utf-8') as f1:
for line in f1:
line.replace('\n', '')
textlist.append(line)
lac = hub.Module(name="lac")