OpenTag: Open Attribute Value Extraction from Product Profiles[KDD 2018]阅读笔记

最新推荐文章于 2024-04-05 09:37:01 发布

Cris_Lee卡卡卡

最新推荐文章于 2024-04-05 09:37:01 发布

阅读量1.1k

点赞数

分类专栏：自然语言处理 NLP NLP领域-顶会论文-总结与分析文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lrs1353281004/article/details/99605398

版权

NLP 同时被 3 个专栏收录

14 篇文章 0 订阅

订阅专栏

自然语言处理

12 篇文章 0 订阅

订阅专栏

NLP领域-顶会论文-总结与分析

9 篇文章 12 订阅

订阅专栏

论文名称：OpenTag: Open Attribute Value Extraction from Product Profiles
论文出处：KDD 2018
论文地址：https://arxiv.org/pdf/1806.01264.pdf

论文要点

文章基于产品说明书数据。
将属性值抽取转化为序列标注问题处理。
基本模型： bi-lstm + attention + CRF
采用主动学习方法

数据示例

在这里插入图片描述
标题中包含两种待提取的属性值：规格和口味。

模型pipeline

两个难题

文章中提出此类任务中的两个难题

如何从非结构化文本中提取感兴趣的属性值？尤其是当要提取的属性值在之前的数据中未曾出现过，如何处理？
能否通过有限的标注数据建立模型？能否提高模型的可解释性？

任务转化

We formulate our problem as a sequence tagging task similar to named entity recognition (NER).
将属性抽取转化为类似命名实体识别的序列化标注问题来处理。

数据形式定义

在这里插入图片描述
概括来说就是从非结构化文本中提取我们所关心属性的对应属性值。一个属性可能对应多个属性值，如口味属性可能具有多种不同属性值。
本文采取的序列标注方式为{B,I,O,E}

模型结构

模型结构以目前的角度看已经属于比较经典的模型，这里不再赘述。主要就是在经典的bi-lstm+CRF模型中添加了attention层。
在这里插入图片描述
attention层实现方式如下：

ACTIVE LEARNING

本文提出的主动学习策略：
在这里插入图片描述
主动学习的主要思路是根据少量的有标签样本训练初始模型，对未知样本进行预测，然后设定询问策略，将符合标准的样本进行标注，加入有标签训练集，如此循环，直到达到设定的停止标准。
本文主动学习关键点在于询问策略制定，采用了标签翻转（tag flips）作为评判指标，
通俗讲就是，选择一组序列中，在多个epoch内，模型预测标签变化次数最多的序列，进行人工标注。
在这里插入图片描述

实验与结果

此部分不再详细记录了，可以直接查看论文。

Cris_Lee卡卡卡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenTag: Open Attribute Value Extraction from Product Profiles[KDD 2018]阅读笔记

论文名称：OpenTag: Open Attribute Value Extraction from Product Profiles论文出处：KDD 2018论文地址：https://arxiv.org/pdf/1806.01264.pdf论文要点文章基于产品说明书数据。将属性值抽取转化为序列标注问题处理。基本模型： bi-lstm + attention + CRF采用主动学...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。