近100场大模型比赛,拆解大模型发展热点 本文总结了近100场大模型比赛,探讨了大模型技术在各个领域的应用和竞赛情况,包括逻辑推理、安全问题、行业应用、硬件落地、人机区分以及多模态大模型等,为大模型的研究和应用提供了丰富的索引和视角。文章还分析了大模型竞赛的趋势和热点,以及如何通过比赛推动大模型技术的发展。
深度学习训练过程中出现loss为nan的排查思路 最常见的就是出现了除0或者log0这种,看看代码中在这种操作的时候有没有加一个很小的数,但是这个数数量级要和运算的数的数量级要差很多。在optim.step()之前裁剪梯度。
我的创作纪念日 还记得 2019 年 07 月 07 日,当时在参加一个比赛需要用到云服务器,由于第一次接触所以在网上找了很多云服务器的注册和配置教程,但是发现很多分享都写的不够全面,于是萌生了把整个配置过程撰写成一篇博客分享出来的想法。自此我的第 1 篇技术博客:《滴滴云服务器的注册与快速配置教程》诞生了,而也正是从那开始,我开始了我的分享之旅。在创作的过程我认为最大的收获便是培养了自己对知识的梳理和归纳能力,同时将博客作为的平时的随记,也方便了后期的查看。希望未来能够继续保持创作的热情与动力。