九、项目拓展
1.增加水稻疾病问诊内容
任务描述
在上述任务中,实现了用户通过描述“水稻病症状”查询“水稻疾病”的功能。但在实际使用中,水稻疾病问诊不仅仅只能问诊疾病,还应包括“防治措施”等内容,即用户不仅可以通过症状查询水稻所换何种疾病,还能够查询到某种疾病应该如何防治。因此,在本任务中,完善水稻疾病问诊的内容,在原有系统的基础上增加“防治措施”的查询。
知识点:数据收集、命名实体识别、句子相关性判断、知识图谱的搭建与查询(Neo4j)
重 点:数据收集、命名实体识别、句子相关性判断、知识图谱的搭建与查询(Neo4j)
难 点:数据收集、命名实体识别、句子相关性判断、知识图谱的搭建与查询(Neo4j)
内 容:1. 收集水稻疾病防治措施数据
2. 命名实体识别数据标注
3. 训练命名实体识别模型
4. 搭建水稻疾病知识图谱
5. 收集句子相关性判断数据集
6. 训练句子相关性判断模型
7. 部署句子相关性判断模型
8. 对话生成
9. 调试水稻疾病在线问诊平台
10. 调试微信公众号
1. 收集水稻疾病防治措施数据
对应收集每种水稻疾病对应的防治措施,可将“防治措施”数据添加到每种水稻疾病对应的txt文件中。
2. 命名实体识别数据标注
使用doccano工具重新标注部分非结构化水稻疾病文本,将”水稻病症状“和“防治措施”实体词标注出来。
3. 训练命名实体识别模型
使用新标注的数据,重新微调UIE模型,并使用微调好的UIE模型,将剩余非结构化水稻疾病文本中的”水稻病症状“和“防治措施”实体词提取出来。
4. 搭建水稻疾病知识图谱
重新搭建水稻疾病知识图谱,将”水稻疾病“实体词(水稻疾病名称)、”水稻病症状“和“防治措施”实体词写入Neo4j,并在”水稻疾病“和”水稻病症状“节点之间创建“dis_to_sym”关系,在“水稻疾病”和“防治措施”结点之间创建“has_measures”关系。
5. 收集句子相关性判断数据集
根据新的实体词,重新构造句子相关性判断数据集。
6. 训练句子相关性判断模型
使用新收集的句子相关性判断数据集重新训练句子相关性判断模型。
7. 部署句子相关性判断模型
使用Flask框架将重新训练的句子相关性判断模型进行部署上线。
8. 对话生成
重新定义对话生成规则,增加水稻疾病“防治措施”内容的查询。
9. 水稻疾病在线问诊平台
调试“智能问诊”功能,能够正确进行对话,并能够正确查询水稻疾病和防治措施。
10. 调试微信公众号
调试微信公众号,能够正确进行对话,并能够查询水稻疾病和防治措施。
除此之外,同学们还可以继续增加其他智能问诊内容,或者扩展其他农作物的问诊内容,让“在线问诊平台”不仅可以问诊水稻疾病,还可以问诊其他农作物的相关知识。