优雅谈论大模型2:模型顿悟

前言

大模型领域的技术和模型日新月异。如何读懂一个模型,需要先理解语料、算力以及模型参数之间的关系,例如,如何预估大模型的运算所需要的参数,如何预估大模型的训练时长,一定规模参数的大模型喂入多少量级的语料才是最优,或者有没有在某种情况下模型越大任务的效率越差。

大模型的顿悟

大模型和人一样,需要不断地“参禅”,经历不同的事情且从其中获取感知,破解个人的思维瓶颈之后才会迎来“顿悟”。

请注意上面的红线,红线的意思是随机猜测。可以从图中发现在训练的算力达到一定层度的时候,准确度才会扭头向上,这也就是所谓的大模型的顿悟时刻。而这个顿悟临界

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值