智源社区AI周刊No.105:谷歌FLAN-T5 30亿参数即超越GPT-3性能;Copilot推出语音编程新功能,但面临诉讼...

社区周刊今日改版!汇聚每周AI热点,不错过重要资讯!欢迎扫码,关注并订阅智源社区AI周刊。

3e4c65bf6d4b4a6ec9aa158d9d89f7b1.png

提示工程模拟人类思考模式,推理等任务迎来曙光


谷歌近日发布的新提示工程方法,再次说明了数据和训练方式对大模型性能的影响。今年早些时候提出的Chain-of-Thought(CoT)方法,结合其他指令微调方式,在PaLM、T5等模型上进行了验证,让30亿规模的模型性能超过了1750亿的GPT-3。智源社区也邀请了该论文通讯作者侯乐做报告分享。

5cf1c5a25b69213864d6492d2a580f02.png

同时,Self-consistency和Least-to-most方法,模仿了人类在推理中的多策略投票和复杂问题拆解机制,或许在将来也能够在大模型上进行验证。提示工程融合人类思维模式的方法,相比单纯的无监督语料学习提供给了大模型更多建模人类思考方式的能力。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值