信息抽取
文章平均质量分 72
本专栏主要介绍基于深度学习的命名实体识别与关系抽取,包括命名实体识别与关系抽取的相关概念,实现技术包括玄幻神经网络,长短期记忆神经网络,概率图模型,卷积神经网络,端到端模型,注意力机制,图数据库,最后给出TensorFlow源码以及项目Github源码
华师数据学院·王嘉宁
研究方向:深度学习、自然语言处理、知识图谱。
研究兴趣:大语言模型训练与推理、知识增强预训练、Prompt-tuning、小样本学习、问答系统、信息抽取。
展开
-
论文解读:Denoising Distant Supervision for Relation Extraction via Instance-Level Adversarial Training
论文解读:Denoising Distant Supervision for Relation Extraction via Instance-Level Adversarial Training 本文是一篇以生成对抗网络为出发点的远程监督关系抽取文章,其使用GAN来完成噪声数据的过滤,其相比普通的multi-instance能够更有效的过滤出噪声,避免multi-instance的at-le...原创 2020-03-26 12:29:02 · 943 阅读 · 1 评论 -
论文解读:A Hierarchical Framework for Relation Extraction with Reinforcement Learning
论文解读:A Hierarchical Framework for Relation Extraction with Reinforcement Learning 关系抽取是一项比较基础的自然语言处理任务,而联合实体和关系抽取则是一种端到端的方法。传统的方法基本上是先通过实体识别再进行关系抽取,但这容易导致误差传播。为了能够有效提高抽取的效果,本文提出一种基于分层的强化学习框架用于关系抽取。一、简要信息序号属性值1模型名称HRL-RE2所属领域自然语言处理3原创 2020-05-30 10:45:40 · 1478 阅读 · 3 评论 -
博主最新科研论文已收录于ArXiv:利用强化学习与分层搜索提升关系抽取,欢迎阅读引用
博主最新科研论文已收录于ArXiv:利用强化学习与分层搜索提升关系抽取,欢迎阅读引用Title:RH-Net: Improving Neural Relation Extraction via Reinforcement Learning and Hierarchical Relational Searching下载地址:https://arxiv.org/abs/2010.14255Abstract:Distant supervision (DS) aims to generate large原创 2021-02-15 09:50:12 · 420 阅读 · 0 评论 -
论文解读:Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
论文及源码解读:Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification 在基于深度学习的知识图谱构建过程中,知识抽取环节中的实体关系抽取至关作用。本博文将解读2016年由中国科学技术大学Peng Zhou等在ACL发表的论文《Attention-Based Bidirec...原创 2019-05-06 13:31:05 · 7672 阅读 · 2 评论 -
论文解读:Enriching Pre-trained Language Model with Entity Information for Relation Classification
论文解读:Enriching Pre-trained Language Model with Entity Information for Relation Classification 在自然语言处理领域内,基于语义的关系分类一直是热门研究内容之一。本文运用了最新提出的BERT模型,并添加相关结构构成实体分类模型,该模型实验F1值为89.25,再次成为SemEval 2010 Task 8数...原创 2019-07-20 21:37:45 · 4747 阅读 · 12 评论 -
论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction?
论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction? 远程监督关系抽取普遍遭受噪声的影响,先前的工作一直关注如何降低噪声对分类产生的错误影响,例如通过多示例学习以及句子级别的注意力机制,或者使用强化学习、对抗学习直接过滤噪声等。本文则完全从新的角度出发——是否可以将那些可能是噪声的标签纠正,这样即不会降低语料的数量,也能直接提升语料的质量。一、简要信息序号属性值1模型名称DC原创 2020-09-02 21:06:55 · 712 阅读 · 1 评论 -
基于深度学习的命名实体识别与关系抽取
基于深度学习的命名实体识别与关系抽取摘要:构建知识图谱包含四个主要的步骤:数据获取、知识抽取、知识融合和知识加工。其中最主要的步骤是知识抽取。知识抽取包括三个要素:命名实体识别(NER)、实体关系抽取(RE)和属性抽取。其中命名实体识别(NER)和实体关系抽取(RE)是自然语言处理(NLP)任务中非常重要的部分。 本文将以深度学习的角度,对命名实体识别和关系抽取进行分析,在阅读本文之前,读者...原创 2020-03-10 09:53:45 · 64704 阅读 · 58 评论 -
从文本中自动抽取结构化三元组
从文本中自动抽取结构化三元组参考文献【1】:ICDM2019 Knowledge Graph Contest: Team UWA参考文献【2】:Seq2KG: An End-to-End Neural Model for Domain Agnostic Knowledge Graph (not Text Graph) Construction from TextGitHub:https://github.com/Michael-Stewart-Webdev/Seq2KG现有工作缺点: Open原创 2020-11-30 16:24:23 · 8861 阅读 · 13 评论 -
中文维基百科数据爬取与预处理
中文维基百科数据爬取与预处理 前言:阅读本篇博文,您将学会如何使用scrapy框架并基于层次优先队列的网页爬虫以及维基页面的结构与半结构数据自动抽取。项目已经开源于GitHub地址:https://github.com/wjn1996/scrapy_for_zh_wiki,欢迎Star或提出PR。 维基百科(wikipedia) 是目前最大的开放式开放领域百科网站之一,包含包括英文、中文等多种语言。现如今在众多人工智能自然语言处理任务中均取自于维基百科,例如斯坦福大学开源的机器阅读理解评测数据集S原创 2020-11-26 22:42:59 · 12052 阅读 · 22 评论 -
论文解读:Combining Distant and Direct Supervision for Neural Relation Extraction
论文解读:Combining Distant and Direct Supervision for Neural Relation Extraction夏栀的博客——王嘉宁的个人网站 正式上线,欢迎访问和关注:http://www.wjn1996.cn 远程监督关系抽取一直存在一个问题就是噪声,现如今有诸多工作来解决噪声问题,本文创新点在于结合了远程监督和普通监督学习来实现降噪。一、简...原创 2020-03-15 17:22:18 · 825 阅读 · 0 评论 -
论文解读:ARNOR: Attention Regularization based Noise Reduction for Distant Supervision Relation Class...
论文解读:ARNOR: Attention Regularization based Noise Reduction for Distant Supervision Relation Classification 关系抽取是自然语言处理任务中比较重要的任务,其是知识图谱构建的子任务。现如今常用的方法是基于监督学习方法,但由于人工标注语料太少,且成本较高,不利于大规模图谱的构建,因此远程监督学习...原创 2020-03-14 11:46:28 · 1170 阅读 · 1 评论 -
基于监督学习和远程监督的神经关系抽取
神经关系抽取技术综述作者:王嘉宁 QQ:851019059 Email:lygwjn@126.com 关系抽取作为自然语言处理重要的研究领域之一,一直以来受到国内外诸多高校、科研机构的高度关注。近些年来的ACL、EMNLP、AAAI、IEEE、ICDE、IJCAI等顶会,以“Relation Extraction”或“Relation Classification”为关键字的论文逐年增加...原创 2020-09-27 22:03:37 · 6871 阅读 · 9 评论 -
中学数学知识点实体识别
中学数学知识点实体识别构建中学数学知识图谱的第一步是完成数学命名实体识别。1. Overview 本文定义是:中学数学学科知识点指客观存在的数学知识实体及其对应的抽象内容。客观存在的实体即例如“三角形”、“数列”、“平面向量”等指代一个数学的概念;抽象是指基于这些客观实体的一些数学“方法”、“定理”等,例如“边角边定理”是基于三角形的全等的定理,“裂项相消法”是基于“数列”求和的一种方法,...原创 2019-09-28 21:04:18 · 2151 阅读 · 1 评论