智源社区AI周刊No.105：谷歌FLAN-T5 30亿参数即超越GPT-3性能；Copilot推出语音编程新功能，但面临诉讼...

智源社区

于 2022-11-11 17:05:39 发布

阅读量489

点赞数

文章标签：人工智能 gpt-3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/128031014

版权

社区周刊今日改版！汇聚每周AI热点，不错过重要资讯！欢迎扫码，关注并订阅智源社区AI周刊。

提示工程模拟人类思考模式，推理等任务迎来曙光

谷歌近日发布的新提示工程方法，再次说明了数据和训练方式对大模型性能的影响。今年早些时候提出的Chain-of-Thought（CoT）方法，结合其他指令微调方式，在PaLM、T5等模型上进行了验证，让30亿规模的模型性能超过了1750亿的GPT-3。智源社区也邀请了该论文通讯作者侯乐做报告分享。

同时，Self-consistency和Least-to-most方法，模仿了人类在推理中的多策略投票和复杂问题拆解机制，或许在将来也能够在大模型上进行验证。提示工程融合人类思维模式的方法，相比单纯的无监督语料学习提供给了大模型更多建模人类思考方式的能力。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
智源社区AI周刊No.105：谷歌FLAN-T5 30亿参数即超越GPT-3性能；Copilot推出语音编程新功能，但面临诉讼...

社区周刊今日改版！汇聚每周AI热点，不错过重要资讯！欢迎扫码，关注并订阅智源社区AI周刊。提示工程模拟人类思考模式，推理等任务迎来曙光谷歌近日发布的新提示工程方法，再次说明了数据和训练方式对大模型性能的影响。今年早些时候提出的Chain-of-Thought（CoT）方法，结合其他指令微调方式，在PaLM、T5等模型上进行了验证，让30亿规模的模型性能超过了1750亿的GPT-3。智源社区也邀请了...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。