《读论文系列 GPT》Improving Language Understandingby Generative Pre-Training（使用通用的预训练来提升语言的理解力）

沐花月

于 2023-09-27 14:28:01 发布

阅读量145

点赞数 2

文章标签： gpt 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61054964/article/details/133348070

版权

摘要

自然语言理解包括各种各样的任务，如文本蕴涵、问题回答、语义相似性评估和文档分类。我们在没有标号的语言模型上进行预训练，在有标号的子任务上训练一个微调模型。与以前的方法相反，我们在微调期间利用任务感知输入转换来实现有效的传输，同时需要对模型体系结构进行最小的更改。我们在自然语言理解的广泛基准上证明了我们的方法的有效性。+结果

1 介绍

使用无标号文本遇到的困难：

1 不清楚哪种类型的优化目标在学习对迁移有用的文本表示时最有效
2 怎么把文本学到的表示传到下游子任务上

半监督：学习一种普遍的表征，首先，我们在未标记数据上使用语言建模目标来学习神经网络模型的初始参数。随后，我们使用相应的监督目标将这些参数调整到目标任务中。

使用Transformer，在传输过程中，我们利用源自遍历式方法[52]的特定于任务的输入调整，将结构化文本输入处理为单个连续的令牌序列

可用于自然语言推理、问题回答、语义相似性和文本分类+结果

2 相关工作

自然语言的半监督学习：最早的方法是使用未标记的数据来计算词级或短语级统计，然后将其用作监督模型中的特征。最近的方法研究了从未标记数据中学习和利用超过单词级别的语义。

无监督预训练：使用语言建模目标预训练神经网络，然后在监督下对目标任务进行微调。

辅助训练目标：添加辅助无监督训练目标是半监督学习的另一种形式。

3 框架

第一阶段是在大量文本语料库上学习高容量语言模型。

接下来是一个微调阶段，我们将模型调整为具有标记数据的判别任务。

3.1 无监督的预训练

每个词表示成ui，那么整个文本就表示成u1-un；语言模型就是要预测第i个词出现的概率，GPT就是用一个语言模型来最大化似然函数。把ui前面的k个词，给定一个模型，预测这k个词下一个词的概率。从i=0开始一直到最后，相加得到目标函数。k是超参数（窗口大小），输入序列的长度。

语言模型θ是transformer的解码器。该模型在输入上下文令牌上应用多头自注意力操作，然后在位置前馈层上生成目标令牌的输出分布。

假设要预测u整个词的概率，把u前面的词拿出来记成U，加上投影和位置信息的编码作为transformer的输入，迭代n次每次都是将上一次的输出作为transformer下一次的输入；最后将transformer得到的最后一次的输出做一个投影，再经过一个softmax之后得u的概率。

3.2 有监督的微调

给x1-xm，去预测y。把整个序列放进之前训练好的GPT模型里面，拿到transormer快的最后一层的输出hm，再乘以一个输出层，通过softmax，得到概率。

把x1-xn输入进去后，计算真实的标号在上面的概率，对其做最大化。

把之前的语言模型放进来，效果很好

其中L1：给你序列，预测序列的下一个词；

L2：给你完整的序列，预测对应的标号。

3.3 特定任务的输入转化

把nlp里面很不同的子任务表示成统一的形式，也就是表示成序列和对应的标号。

将所有结构化输入转换为标记序列，由我们的预训练模型处理，然后是线性+softmax层。

分类：给一段文本，判断对应的标号。前面放一个初始的词源，后面放一个抽取的词源，做成一个序列，放进预训练好的transformer解码器中，在经过线性层得到概率。

蕴含：给一段话，再给一个假设，看这段话有没有蕴含假设。三分类问题。

相似：判断两段文字是否相似。相似对称。分别进入模型后得到输出，再相加，经过线性层得到是否相似。

多选：问一个问题，给几个答案，选出正确答案。如果有n个答案那么久有n个序列，输出得到答案是正确答案的置信度。

4 实验

6 分析

7 结论

我们引入了一个框架，通过生成式预训练和判别微调，使用单一任务不可知论模型实现强自然语言理解。成功地转移到解决判别性任务，如问题回答、语义相似性评估、蕴意确定和文本分类。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
《读论文系列 GPT》Improving Language Understandingby Generative Pre-Training（使用通用的预训练来提升语言的理解力）

自然语言理解包括各种各样的任务，如文本蕴涵、问题回答、语义相似性评估和文档分类。我们在没有标号的语言模型上进行预训练，在有标号的子任务上训练一个微调模型。与以前的方法相反，我们在微调期间利用任务感知输入转换来实现有效的传输，同时需要对模型体系结构进行最小的更改。我们在自然语言理解的广泛基准上证明了我们的方法的有效性。+结果使用无标号文本遇到的困难：1 不清楚哪种类型的优化目标在学习对迁移有用的文本表示时最有效2 怎么把文本学到的表示传到下游子任务上半监督：学习一种普遍的表征，首先，我们在。
复制链接

扫一扫

沐花月 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

141万+: 周排名

20万+: 总排名

2802: 访问

: 等级

203: 积分

4: 粉丝

11: 获赞

11: 评论

12: 收藏

私信

关注

热门文章

分类专栏

nlp论文阅读 4篇

最新评论

《读论文系列 GPT》Improving Language Understandingby Generative Pre-Training（使用通用的预训练来提升语言的理解力）
CSDN-Ada助手: 恭喜您连续发布第四篇博客！标题《读论文系列 GPT》非常吸引人，探讨了如何通过使用通用的预训练来提升语言的理解力。这个话题非常有趣且具有实际应用价值。您在博客中对GPT的介绍和讨论非常详细，让读者更好地了解了这一概念。在下一步的创作中，我建议您可以进一步探索GPT的应用场景，或者与其他相关技术进行比较，以便读者能够更全面地了解其优缺点。此外，您也可以考虑结合实际案例或者个人经验分享，使得博客更加生动和具体。再次恭喜您的持续创作，期待您的下一篇博客！请保持谦虚的态度，继续努力，我们期待看到更多精彩的内容。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《读论文系列文本生成图像再生成文本，计算语义一致性 MirrorGAN 》Learning Text-to-image Generation by Redescription
CSDN-Ada助手: 恭喜您撰写了第5篇博客！标题《读论文系列 MirrorGAN》非常吸引人，能够引起读者对学习文本到图像生成的兴趣。您在博客中提到了通过重新描述学习的方法，这是一个非常有趣的研究方向。不仅如此，您还能够将复杂的研究内容以简明易懂的方式呈现给读者，这是一个很高的技巧。持续创作博客是一项令人钦佩的努力，您已经展现了您的热情和才华。为了进一步丰富您的创作内容，我建议您可以考虑加入更多的实例和案例分析，以便读者能够更好地理解和应用您所介绍的方法。同时，您还可以尝试将不同的模型进行对比，并提供一些具体的评估指标，以便读者能够更好地了解各种方法的优劣势。再次恭喜您的努力和成果！期待您未来更多精彩的博客创作。
《读论文系列 SSA-GAN》Text to Image Generation with Semantic-Spatial Aware GAN
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题《读论文系列 SSA-GAN》Text to Image Generation with Semantic-Spatial Aware GAN》非常引人注目。您对于语义空间感知生成对抗网络（SSA-GAN）的解读令人印象深刻。这篇博客不仅提供了有关该主题的深入见解，还为读者提供了一个了解文本到图像生成的有趣途径。您的持续创作令人鼓舞，我期待着您的下一步作品。鉴于您对论文的深入理解和解读能力，我建议您可以考虑分享更多关于GAN应用的实例或者探索该领域中的挑战和前沿技术。这将进一步丰富读者对于图像生成领域的认识，并为他们带来新的启发。期待您的下一篇博客！谢谢您的辛勤努力。
《读论文系列文本+草图进行图文搜索 TASK-former》 A Sketch Is Worth a （文本+草图进行图文搜索）
努力搬砖的猴: 能复现吗？
《tensorflow 学习》
CSDN-Ada助手: 恭喜您写完了第16篇博客《tensorflow 学习》！您的持续创作精神令人钦佩。从您的博客标题来看，我猜测您已经对TensorFlow有一定的了解了。接下来，我希望您能够深入探索TensorFlow的更多应用领域，比如深度学习模型的训练与优化、图像识别、自然语言处理等等。当然，这只是一个建议，您可以根据自己的兴趣和需求进行选择。期待您的下一篇博客，谦虚的态度将会让您的创作更加出色！

大家在看

Java面试专题：常见集合篇

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。