自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 什么是未登录词 Out-of-vocabulary(OOV)?

未登录词就是训练时未出现,测试时出现了的单词。在自然语言处理或者文本处理的时候,我们通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的,或者是自己定义的,或者是从当前数据集提取的。假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是Out-of-vocabulary,简称OOV。...

2019-06-19 10:27:10 11116 1

原创 《GRN: Gated Relation Network to Enhance Convolutional Neural Network for Named Entity Recognition》

问题: 命名实体识别(NER)的主流方法大多采用RNN,如长短时记忆(LSTM)。然而,RNN以顺序方式处理句子。 这可能导致当前时间步骤的计算高度依赖于先前时间步骤的计算。 RNN的这种固有顺序性质使他们无法在训练示例上充分利用GPU并行性,因此可能导致更高的训练和测试时间成本。 与RNN不同,卷积神经网络(CNN)可以前馈方式处理所有单词,而不是逐句地在每个单词上构成表示。然而,...

2019-05-24 17:23:19 2018

原创 《Distantly Supervised NER with Partial Annotation Learning and Reinforcement Learning》

问题:早前对NER的大多数研究都集中在一组预定义的NER类型上,比如人名、地名、组织名、日期等等,提供了一定数量的标记数据来训练模型。然而,不同的应用场景需要特定的实体类型,如电子商务领域的“Brand”和“Product”,金融行业的“Company”。考虑到人工标注的高成本,为每种新的NER类型标注大量数据是不可行的,但有时可以使用小规模数据。 方法:远程监控可以为新型NER自动生成大规模的...

2019-04-27 10:29:18 1619 1

原创 《A Neural Layered Model for Nested Named Entity Recognition》

问题:大多数命名实体识别(NER)系统只处理平面实体,而忽略了内部嵌 套实体,这无法捕获底层文本中的细粒度语义信息。 方法:为了解决这个问题,我们提出了一种新的神经模型,通过动态叠加平面NER层来识别嵌套的实体。模型将LSTM层的输出合并到当前平面NER层中,为检测到的实体构建新的表示,并随后将它们提供给下一个平面NER层。模型动态地堆加平面NER层,直到没有提取任何外部实体。flat NER...

2019-04-27 10:07:08 2254 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除