论文阅读笔记-CTRL: A Conditional Transformer Language Model For Controllable Generation

前言

CTRL: A Conditional Transformer Language Model For Controllable Generation

2019年推出GPT-3,和它以往的风格一样,模型巨大参数超多,在生成文本能力上表现惊人,不过GPT模型生成的文本风格往往由模型自身决定(和训练语料有关,有着一定的随机性)。而本篇所要提的模型CTRL(Conditional Transformer Language Model),对标GPT-2,可以更好的控制文章的内容,生成有价值的文本,且无需进一步训练就可以解决特定领域的具体问题。CTRL模型的最大优势是在生成文本时可指定文章的类型,同一模型可以写作不同风格的文章,可以指定文章的领域、风格、主题、时间、实体,实体间的关系,以及任务相关的行为等等。模型使用的Control Code和sub-reddit data如下:
在这里插入图片描述

不同的角度,有不同的答案。换言之,CTRL关注了语料在不同场景中的不同含义。模型更符合实际应用的场景:使用者在同一时间,只可能生成某一特定类型,同时又希望单个模型支持生成各种类型的文章,CTRL可视为多任务学习。使用 CTRL,只要提供control code,control code可以是 URL、问题和语言,也可

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

墨痕_777

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值