知识图谱
1、领域
- 垂直领域:某个领域如医疗诊断、工程机械、金融
- 开发领域:多个垂直领域
2、问答系统
客服机器人
- 闲聊型:微软的小冰
- 任务型:客服机器人
对话
- 单轮对话
- 多轮对话
- 检索式问答
模型
- 流水线(Pipeline)
- 端到端(end-to-end)
基于知识图谱的应用–问答系统
知识图谱+单轮对话+检索式问答+流水线(单模块)
1、整体架构
1.1 构建一个知识图谱
- 数据收集:结构化、半结构化、非结构化
- 知识抽取:Schemo定义、数据标注工具、实体关系抽取、实体名称归一、实体对齐
- 知识存储:neo4j、mysql、elasticsearch
1.2 问答–自然语言处理模块(NLU)
- 意图识别:意图归纳、意图分类模型
- 槽位填充:语义槽设计、命名实体识别、实体链指
1.3 知识计算模块
- 图数据库操作:Ctpher语言
- 问题检索:文本倒排索引、文本向量化表示、Faiss向量索引
- 业务逻辑
1.4 对话管理模块+交互模块
- 后端:Redis、Flask/django、对话策略设计
- 前端:itchat
1.5 模型API接口服务
- 深度学习平台:TensorFlow、Keras
- 模型发布:Bert-as-serving、flask