2024年深度学习在NLP领域的进展和趋势(1)，Android小技巧

最新推荐文章于 2024-06-24 11:49:15 发布

2401_83974590

最新推荐文章于 2024-06-24 11:49:15 发布

阅读量949

点赞数 23

分类专栏： 2024年程序员学习文章标签：深度学习自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_83974590/article/details/137213006

版权

本文探讨2024年深度学习在NLP领域的进展，聚焦于情感分析任务，特别是SemEval 2017比赛，介绍了参赛系统如BB_twtr，涉及CNN、LSTM模型的应用。此外，文中提到了内部注意力机制、强化学习和抽象摘要系统的最新发展，以及在端到端模型上的成功。同时，还分享了一些NLP工具如AllenNLP、ParlAI和OpenNMT的相关信息。

摘要由CSDN通过智能技术生成

本方法使用的是multiplicative LSTM模型，主要的原因就是它比普通的LSTM模型更容易收敛。在Amazon评价语料库上训练使用了4096个单元。

为什么情感倾向判断的准确度高依然未知。读者可以尝试着训练一个自己的模型并做一些实验，作者的训练花了大概一个月时间。

推特與情分析

推特上的與情分析是一个很有力的工具，人们对某个商业品牌的评价，分析营销活动的影响，竞选活动中希拉里和川普在大众中的评价。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

SemEval 2017

推特與情分析不仅受到了NLP领域的广大研究者的关注，也受到政治家和社会活动家的关注。因此从2013年开始，SemEval提出了对应的任务-情感分析。

今年，有48支队伍参与这项任务。今年的5个任务为：

1.子任务A：给定一条推文，判断积极、消极、平和三种情感。

2.子任务B：给定一条推文和一个主题，将主题判断为积极或者消极。

3.子任务C：给定一条推文和一个主题，将推文分为：强烈的积极、轻微的积极、平和、轻微的消极、强烈的消极。

4.子任务D：给定关于某个主题的推文，评估这些推文在消极和积极的分布。

5.子任务E：给定关于某个主题的推文，评估这些推文在强烈的积极、轻微的积极、平和、轻微的消极、强烈的消极中的分布。

参赛队伍中有20个队伍使用了CNN或LSTM模型。尽管如此，SVM模型依然流行，有一些队伍结合了神经网络方法或使用了词嵌入特征。

The BB_twtr system

该组工作发布在(Cliche, 2017)，英语组中5个子任务排列第一。作者结合了10个CNN和10个biLSTM用来训练不同的超参和不同的预训练策略。在他们的论文中详细的叙述了网络的结构。

为了训练模型，作者使用了人工标注的推文（子任务A标注了49693条）以及没有标注的1亿推文（只是简单的标记了积极和消极）。这些推文都经过了小写、符号化、特殊符号替换链接和表情、统一重复的字母（比如niiice,niiiiiice统一为niice）。

作者使用了word2vec, GloVe and fastText等方法训练词向量，结果表明并没有哪个方法能够取得更明显的效果，因而作者采用了一种投票的策略。

令人激动的抽象摘要系统

自动摘要和自动翻译是NLP中首要的任务，目前主要有2中方法：基于抽取的方法，从原文中抽取最重要的片段；基于抽象的方法，通过生成摘要。之前基于抽取的方法处于主流地位，由于更为简单的缘故。

去年，基于RNN模型在文本生成中取得了不可思议的效果，尤其是在断文本的输入和输出，但是在长文本中却取得很差的结果。

最低0.47元/天解锁文章

关注

23
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
2024年深度学习在NLP领域的进展和趋势(1)，Android小技巧

自动摘要和自动翻译是NLP中首要的任务，目前主要有2中方法：基于抽取的方法，从原文中抽取最重要的片段；基于抽象的方法，通过生成摘要。之前基于抽取的方法处于主流地位，由于更为简单的缘故。去年，基于RNN模型在文本生成中取得了不可思议的效果，尤其是在断文本的输入和输出，但是在长文本中却取得很差的结果。提出了一种神经网络模型克服了这个局限性。如下图所示，结果是令人振奋的。作者使用biLSTM对输入进行编码，然后使用LSTM解码生成输出。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。