自然语言处理
Irving_III
左青龙,右白虎,中间一个米老鼠
展开
-
【论文IJCAI】Attention as Relation:Learning Supervised Multi-head Self-Attention for Relation Extration
论文链接:https://www.ijcai.org/Proceedings/2020/0524.pdf论文源码:https://github.com/NKU-IIPLab/SMHSA 这是IJCAI2020的联合实体关系抽取论文,也是主要针对实体重叠的三元组识别问题。这篇文章把任务分成3个部分分别处理各自问题进行抽取得到较好结果。Abstract 联合实体和关系提取是许多自然语言处理任务的关键问题,已引起人们越来越多的研究兴趣。但是,它仍然面临着识别与整个实体边界重叠的关系三联以及检测多类型.原创 2020-10-22 10:29:39 · 1322 阅读 · 1 评论 -
【论文阅读笔记PCNN】Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks
论文链接:http://aclweb.org/anthology/D/D15/D15-1203.pdf论文模型:PCNN 这篇文章是Zeng在2014年CNN经典论文之后的有益著作,这篇论文提出PCNN方法,将卷积网络特征提取应用于远距离监督,而且还引入多示例学习方法。1 摘要 文章开头就提出两个关于使用远距离监控进行关系抽取时会出现饿问题。首先,在这种方法中,启发式地将一个已经存在的知识库与文本对齐,并将对齐结果作为标记数据处理。然而,启发式对齐可能会失败,导致错误的标签问题。此外,在...原创 2020-08-01 15:53:32 · 1505 阅读 · 2 评论 -
【cs224n学习作业】Assignment 1 - Exploring Word Vectors【附代码】
前言这篇文章是CS224N课程的第一个大作业, 主要是对词向量做了一个探索, 并直观的感受了一下词嵌入或者词向量的效果。这里简单的记录一下我探索的一个过程。 这一下几篇文章基于这次作业的笔记理论:cs224n学习笔记 01: Introduction and word vectors.cs224n学习笔记 02:Word Vectors and Word Senses.cs224n学习笔记 03:Subword Models(fasttext附代码).cs224n学习笔记 04:Contextua原创 2020-07-06 21:29:27 · 1017 阅读 · 1 评论 -
cs224n学习笔记 03:Subword Models(fasttext附代码)
课程内容语言学的一点小知识词级字符级模型n-gram思想FastText模型1 、人类语言声音:语音学和音系学语音学是音流,这是属于物理层面的东西词法学:一个n-grams的代替方案在基于单词的模型中存在一些问题:需要处理很大的词汇表,在英语中单词只要变个形态就是另一个单词了,比如说:gooooood bye字符级别模型单词嵌入可以由字符嵌入表示:能为不知道的单词生成嵌入相似的拼写有相似的嵌入解决了oov问题传统来说,一个因素或者一个字母不是一个因素单元,但是深度语言模原创 2020-06-29 22:53:32 · 404 阅读 · 0 评论