由于最近需要收集同伴们的核酸检测报告,做成word文档提交,就写了一个程序。本代码推荐使用jupyter notebook打开。
输入数据:图片文件,图片文件命名需为“姓名+其他字段”。
输出要求格式:姓名+固定词(例如:李华核酸检测报告),后填对应图片。
结果示例如下:
图片数据
需要用到的工具包
pip install os #使用 os 工具包读取文件名称
pip install python-docx # 使用python-docx制作word文档
pip install torch #自然语言处理依托环境
pip install fastnlp #自然语言处理依托环境
pip install fastHan #命名实体识别工具包 提取文件名称中的姓名