知识抽取-理论知识

最新推荐文章于 2024-02-18 15:35:58 发布

qq_36646531

最新推荐文章于 2024-02-18 15:35:58 发布

阅读量568

点赞数

分类专栏：关系抽取项目自然语言处理项目

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36646531/article/details/107757238

版权

自然语言处理项目同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

关系抽取项目

2 篇文章 0 订阅

订阅专栏

知识抽取-理论知识

前言
参考连接
涉及技术
应用
关系抽取技术

前言

最近接到两个NLP的项目任务，都涉及到从非结构化文本数据转化为结构化数据插入结构化数据库的任务，可以理解为知识抽取（Information Extraction）任务，本文参考网络文章和视频课程，并做一个简要总结。

参考连接

知识抽取（一）

信息抽取——关系抽取

涉及技术

命名实体识别
抽取实体关系
实体统一
指代消歧

应用

问答系统
扩充原有的知识库（knowledge base）
法律、金融

关系抽取技术

涉及名称：三元组（truple）、 RDF store 、知识图谱（属性图）

基于规则

目前最主流
根据人的经验写规则
优点：不需要大量数据
缺点：人的思维局限性

监督学习（多分类问题）

准备：

定义关系类型
定义实体类型
训练数据准备：标记好实体类型、实体之间的关系

特征工程（关键）

围绕实体提取特征

基于单词的特征（bag of word feature）
pos feature ：名词，名词，动词，……
实体类别：ORG PER……
steming
位置相关的信息：两个实体间包含多少个单词？这句话在本文里的位置？
句法分析相关特征（可忽略）：
依存文法特征（可忽略）：

分类算法

svm
神经网络
GBDT
……
可以现进行一个二分类，如果有关系再进行分类

半监督（有部分标注） & 无监督学习

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
知识抽取-理论知识

知识抽取-理论知识前言参考连接涉及技术应用关系抽取技术基于规则监督学习（多分类问题）准备：特征工程（关键）分类算法半监督（有部分标注） & 无监督学习前言最近接到两个NLP的项目任务，都涉及到从非结构化文本数据转化为结构化数据插入结构化数据库的任务，可以理解为知识抽取（Information Extraction）任务，本文参考网络文章和视频课程，并做一个简要总结。参考连接知识抽取（一）信息抽取——关系抽取涉及技术命名实体识别抽取实体关系实体统一指代消歧应用问答系统
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。