Chapter7-4_來自獵人暗黑大陸的模型 GPT-3

本文为李弘毅老师【來自獵人暗黑大陸的模型 GPT-3】的课程笔记,课程视频youtube地址,点这里👈(需翻墙)。

下文中用到的图片均来自于李宏毅老师的PPT,若有侵权,必定删除。

文章索引:

上篇 - 7-3 BERT and its family - ELMo, BERT, GPT, XLNet, MASS, BART, UniLM, ELECTRA, and more

下篇 - 7-5 Multilingual BERT

总目录

1 为何来自暗黑大陆

GPT-3是一个language model,它的参数量相当巨大,是ELMO的2000倍!要训练一个GPT-3大概要花掉1200万美元!简直是一个炫富专用的模型!GPT-3不光是参数量大,它的论文也是相当大啊,有72页?!和本科生的毕业论文差不多了啊!

正式因为GPT-3的大大大,所以把它称作是来自暗黑大陆的模型,这里的暗黑大陆就是全职猎人里的暗黑大陆,里面都是巨大的怪兽,没看过这部动漫的同学建议补一下。

2 GPT-3的野心

虽然GPT-3和BERT等模型一样,但是GPT-3是不需要针对特定的task做finetune的,也就是说GPT-3只需要预训练就够了。要是这实现了,也太牛了!
ch7-4-1

具体是什么意思呢?GPT-3定义了三种learning,第一个是"few-shot learning",就是先告诉模型要干什么,然后给几个例子,最后给模型一个题目让它做出来;第二个是"one-shot learning",就是告诉模型要干什么,然后给一个例子,最后给模型一个题目让它做出来;最后一个是"zero-shot learning",就是告诉模型要干什么,然后给模型一个题目让它做出来。这就相当于人一样了。而且更值得遗体的是,这里的learning并不是要做梯度下降的那种learning,而是全都作为输入直接塞进去就可以了,这种learning被GPT-3的作者们称作"in-context learning"。
ch7-4-2

3 GPT-3的效果

那么花了那么大工作搞出来的GPT-3效果如何呢?在42个NLP任务上的平均准确率随参数量的变化如下图所示,可见随着参数两的增大,准确率是在一直上升的。
ch7-4-3

GPT-3在closed book QA上的表现如下所示,之前的QA都是给一个knowledge source,让模型从中找出答案,而所谓的closed book就是没有knowledge source的QA,就只给问题,看模型能不能够打上来。在175B参数量的情况下,用few-shot是可以超过SOTA的。
ch7-4-4

GPT-3咋SuperGLUE的表现如下图所示,总结一下就是参数量越大,给的例子越多,模型的表现就越好。
ch7-4-5

GPT-3也可以用在生成任务上,下图是不同参数量下GPT-3生成的文章让人去辨别是不是机器生成时的准确率,当参数量最大时,人几乎已经无法辨别出时机器还是人写的了。
ch7-4-6

GPT-3也会做算术,如下图所示,问它"What is 17 minus 14?"这样的两位数的加减法基本都会回答正确,但是三位数及以上就不灵了。感觉还是数据驱动的原因。
ch7-4-6

当然,GPT-3也有不擅长的任务,比如NLI任务,GPT-3的结果就和随便猜的一样。NLI就是给两句话,让模型判断是矛盾,还是相近,还是中立。

4 Beyond GPT-3

既然我们已经有了这么多那么庞大的language model,我们自然也要给模型难度更大的任务了,比如Turing Advice Challenge,就是让模型去reddit让给别人的求助提建议,然后看人觉得有用的建议有多少。T5这样的大模型也只有9%的建议是有点用的,GPT-3还没试过。可见这是一个很难的任务。期待之后的NLP的发展情况!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: ds918 6.2.3-25426_uefi_gpt_expand.7z 是一个压缩文件,文件格式为7z,压缩程序为7-Zip。这个文件可能是一个操作系统或软件镜像文件。 从文件名可以看出,此文件属于 DS918,可能是指 Synology DS918+ 系列网络存储设备。6.2.3-25426 是此设备上的一个固件版本号,UEFI 表示此固件可以通过 UEFI(Unified Extensible Firmware Interface)引导。GPT 则是指分区表的类型,扩展(expand)可能表示对固件的功能或分区进行扩展。 由于是一个压缩文件,我们需要解压缩才能进一步了解该文件的内容。我们可以使用 7-Zip 等压缩软件进行解压缩。解压缩后,会得到一个或多个文件,这些文件可能包含操作系统、驱动程序、设置文件等。根据文件的具体内容,我们可以选择将其安装到相应的设备上,以更新或扩展设备的功能。 总之,ds918 6.2.3-25426_uefi_gpt_expand.7z 是一个压缩文件,可能包含了 Synology DS918+ 网络存储设备的固件或软件镜像文件。通过解压缩该文件,我们可以获得一些文件来更新设备的功能或扩展其分区。 ### 回答2: ds918 6.2.3-25426_uefi_gpt_expand.7z 是一个文件的名称,它可能是一个压缩文件。后缀名为".7z" 表示这是7-Zip压缩文件。这个文件似乎与DS918 同型号的一款产品、6.2.3 版本的软件以及UEFI和GPT具有一定的关联。 根据文件名的命名规则推测,这个文件可能是一个特定版本的DS918所需要的升级或者扩展包。 "ds918" 可能指的是某款硬件型号或型号系列的产品。 "6.2.3-25426" 则可能是DS918所需要的操作系统版本号。 "uefi" 和 "gpt" 可能表示该文件适用于启动模式为UEFI且硬盘格式为GPT的设备,这是一种比传统的BIOS和MBR引导方式更先进的启动模式和硬盘分区方案。 如果你有一款DS918硬件设备,可以根据这个文件名来判断是否需要进行升级或扩展。你可以解压缩这个文件并按照文档中的指引进行安装。但在进行任何操作之前,请确保你已经备份了重要的数据,并根据官方的操作指南或咨询相关专业人士,以避免不必要的风险或损失。 ### 回答3: ds918 6.2.3-25426_uefi_gpt_expand.7z是一个文件,它可能是一个软件包或压缩文件。其中的扩展名“.7z”表示它是7-Zip压缩格式。ds918可能是指特定的硬件设备或软件版本,而6.2.3-25426_uefi_gpt_expand可能是该版本的特定功能或补丁。 根据文件名中的“expand”一词,可以推测这个文件可能包含了在UEFI(统一的扩展固件接口)系统中进行GPT(GUID分区表)扩展的相关内容。UEFI是一种更新的固件接口标准,用于替代传统的BIOS系统,而GPT是一种磁盘分区表的格式,用于取代传统的MBR(主引导记录)。 鉴于文件的特点,它可能是用于在ds918或使用该软件版本的设备上,通过UEFI方式对GPT分区进行扩展的一项功能或工具。可能是用于管理磁盘空间、重新分配分区容量或创建新的分区等。 要使用该文件,您需要将其下载到您的计算机上,并使用兼容的文件解压工具(例如7-Zip),将其解压缩到目标位置。随后,您可能需要遵循包含的说明或使用相应软件工具来执行相关功能,以实现您的需求。 请注意,我的回答仅基于文件名推测,具体内容仍然需要根据实际情况来确定。如果您需要更多准确的信息,建议您查阅相关文档或软件说明。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

七元权

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值