-
大纲:
-
1、基于非结构话数据的知识抽取
-
2、基于结构化数据的知识抽取
-
3、知识融合与质量评估
基于非结构化数据的知识抽取(比重比较大)
lstm学习特征输入crf生成更复杂的特征
关系抽取抽取的是两个实体之间满足的什么关系
事件抽取更泛化一些,多个实体,多个关系
不同事件抽取内容参数要求不同
不同事件有不同的触发词,触发词包含哪些元素
深度学习特征抽取
CNN:Event Extraction via Dynamic Multi-Pooling Convolutional
RNN:
Joint Event Extraction via Recurrent Neural Networks
小结:
非结构化数据的知识抽取
实体识别:
基于规则和词典的方法
基于统计方法
基于深度学习
关系抽取
规则引擎:Ratel
远程监督
事件抽取
预定义事件的模版
触发词->事件类型 ->参数识别 ->参数角色识别
基于结构化数据的知识抽取(面向对象数据库数据)
知识融合与质量评估
不同数据源数据进行合并