1. 知识图谱与图数据库
存成关系型数据可的问题:
知识图谱存储
2. 企业知识图谱构建技术与挑战
少样本关系抽取
增量关系抽取
主动学习
3. 从零样本做中文知识标注与挖掘(百度)
百科知识树(通用知识)
文本标注挖掘(应用百科知识树)
4. 图谱问答在小爱场景的应用
4.1 整体架构
4.2 信息抽取
-
关系抽取
吴京主演战狼,吴京也导演了战狼
基于指针网络的关系抽取模型:
PSO模型(先抽取P,再抽取s和o)
两种模型召回,然后接入到判别模型里面进行判断
2. 事件抽取
4.3 图谱问答
· 文法解析
· 槽位提取
· 图谱问答
5. 美团大脑: 美食领域知识图谱构建及应用进展
5.1 标签图谱
数据来源:美团点评的评论内容(非结构化自然语言数据,但是有海量的信息存储其中)
1. 标签挖掘: 更多的类似于属性级的观点抽取,跳字标签,就是属性和观点词中间有上下文。 这里把属性词和修饰词(观点词)都当成ner来抽取。
2. 标签关系
标签同义词挖掘
无监督场景下,加入对比学习。 让相似的样本距离更靠近,不同的样本距离更远。在实验效果上,可以去的类似于sentence bert的效果
标签上下位挖掘
类似于标签同义词挖掘
3. 图谱打标
商户打标(商户和用户打标签关联)
POI兴趣点,一般指地理位置
判别模型:
4. 应用
4.1 知识问答
4.2 补充召回
5. 知识图谱表示学习
把tag和poi都作为节点,表示成向量,边就是二者的相似度。表示出来以后,可以直接计算tag和poi之间的相似度
6. 图谱应用于推荐
5.2 菜品知识图谱构建
-
schema层
2. 菜名理解
3. 深度学习模型泛化inference
知识挖掘&显式推理
4. 多模态+结构化 预训练&推理
帮助更好的识别菜品信息
query1: 商户标签怎么定的
人工筛选,人工check
query2:同义词负样本怎么构建?
一开始有一些初始overlap数据,进行标注.
后面用模型预测置信度在0.5附近的样本,送给人工标注
query3:标签图谱存储工具
开源的图数据库
query4: 打标工具:
自己搭建