Improving Language Understanding by Generative Pre-Training

最新推荐文章于 2024-12-30 20:43:59 发布

chansonzhang

最新推荐文章于 2024-12-30 20:43:59 发布

阅读量677

点赞数 1

分类专栏： NLP Papers NLP AI 文章标签：自然语言处理人工智能

本文链接：https://blog.csdn.net/chansonzhang/article/details/119275702

版权

NLP Papers 同时被 3 个专栏收录

54 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

68 篇文章

订阅专栏

NLP

60 篇文章

订阅专栏

本文提出一种半监督方法，通过无监督预训练生成语言模型，然后在多个任务上进行有监督微调，显著提高了自然语言理解的效果。研究显示，预训练阶段使用Transformer结构能捕获更广泛的语言结构，而在微调阶段采用任务感知输入转换，仅需少量模型调整即可实现有效迁移学习。这种方法在多项任务上超越了专门设计的判别式模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Abstract

由于标注数据的缺乏，直接训练判别式模型效果不是很理想。
本文展示了先在大规模未标注语料上预训练生成式语言模型然后在每个判别式任务上进行fine-tuning可以获得较大的效果提升。
相比于以前的方法，本文在fine-tuning阶段利用了task-aware input transformations, 实现了有效的迁移学习并且只需要很少的模型结构调整。