大模型算法领域入行与转行,这样做才能弯道超车!

最近私信问我关于入行、转行方面的问题比较多,就专门写一篇讲讲我的理解。

首先说明一下个人的背景和现状,我本人是本科学历,有互联网大厂搜推方向经验,后来跳到中厂继续做推荐,去年开始做大模型。现在是个小组长,做以应用落地为目的的大模型方向工作。有兴趣的可以翻翻我上一篇内容,讲得比较详细。因为人在中厂,分工不像大厂那么细致,所以基本上上下下都摸过,粗肯定是粗,但是可能适合谈谈全流程的认识,现在大模型算法涉及的工作主要分为这几个方向:
1.偏底层的训练和推理框架工作,比如colossal-ai、vm这些,各厂如果自建集群搭建训练推理框架的话也会有一部分工作与之重合
2.预训练;
3. Alignment;
4.应用开发;

上面也就十分粗略的简单做了个划分,其实很多界限并不清晰,只是为了后面叙述有个结构。

底层框架

这一层我是没太接触过的,不过公司内有做这方面的人。以我粗浅的认知,这些人的技术栈和以前搞GPU算子优化、分布式框架的那拨人重合度比较高。不太懂就不多说了。

预训练

在我看来,预训练这块的工作最终肯定是赢家通吃的。现在只是因为大家都还在同一个水平线上,也没有能和开源拉开差距,卖api也卖不了多少,所以看起来竞争还挺激烈。等到决出三六九等之后肯定没有必要存在那么多团队做pretrain。况且即使做pretrain的团队,真正核心在干活的也没几个人。一千张卡可能不够供一个人用,卡就那么多,配用的人也就那么多。剩下的人做的事情我觉得都不是那么有意义,不是说洗数据啥的不重要,重要,但对大多数人来说,对个人价值提升不大。我之前也自己做基于lama的继续pretrain,现在这块工作已经完全放弃了,感觉没啥意义。

再有,所谓垂直领域大模型这个事情我觉得大概率是个伪命题,各方面知识应该是相互促进补充的,遵循奥卡姆剃刀原理我相信最终就是一个模型破一切。

所以我认为虽然现在预训练目前在就业市场上可能还是有比较大的需求量的,但是很多就是纯跟风,迟早得死。对于择业的建议就是:自信自己顶级天赋顶级卷度,势要干翻gpt4的人选这个。

Alignment

我其实觉得sft和强化学习都可以放一起,不知道我这个小标题准不准确。反正都是在基座上进一步提升对话的效果。这块工作其实就开始一定程度接近业务了,比如目前,很多业务团队都会根据下游任务来构造数据进行sft训练。会不会以后基座足够强之后全靠few shot啥的就完全解决问题,这个我不敢猜测。至少在国内,基于开源模型做sft拿到业务上用,应该是挺长一段时间会保持的状态,所以这个方向看起来我觉得是目前市场上需求较大,未来一段时间也还是会持续有比较大需求量的。想训模型的可以选这个方向我觉得挺好。

应用开发

这一块的岗位其实现在大家看到的还不多,主要可能有两个原因吧,第一是openai的接口在国内直接用是有监管问题的。第二是国内开源模型的水平还不行,以及一些相关链路上的工作还没做完(比如functioncalling)。所以时机还不成熟,还不到LLMnative应
用大规模爆发的时候。

但是我觉得毫无疑问这个方向的人才需求以后将远远超出前面几个方向加起来,这就像是你搞安卓系统和
安卓应用开发的对比一样。做操作系统开发才几个人,安卓开发那真是不知道有多少了。

我预计这个时间也不会太长,一两年肯定够了,所以现在找这个方向的机会开始布局也是很不错的。不过先训训模型等真的有机会起来也没问题,毕竟你做应用开发对系统原理了解清楚肯定是优势。

其他

其实除了上面说这些,还存在一些其他的方向,比如类似guidance这样在align模型之后的,和推理框架绑定比较强的组件,我觉得以后应该会融入到推理框架的范围内。

总结

最后简单总结一下,我认为现在总体的行业形势是资本进行了大规模投入,但是基本堆在预训练上,然后这个环节也容纳不了太多人就业,而且暂时也创造不了多少商业价值。所以很有可能一段时间后会有一个下行的阶段,现在做预训练这些创业公司死一批。然后随着应用端的工作越来越多,大家慢慢把投入方向往下移,往应用端发力,这时候会有一些找准机会和方向的公司出来。顺利的话各种LLM native应用就走入千家万户。(就纯粹我自己的想象哈哈哈)

总的来说我认为LLM肯定是一个好的方向,现在进来不管做什么,也算是比较早的了解原理的人,后面做应用应该也会有一些优势。

然后就是这个东西其实没有那么大难度,有的人会鼓吹需要非常高的学历、有多少多少文章xxx才能做,我觉得没啥道理。我前面说了我是本科学历对吧,虽然我这个情况可能确实比较个例,但是如果大家看我之前写的内容就知道,很多工作其实就是在扣细节这个token对不对,训练推理一致了不xxx的。你说需要多强的数学能力啥的我觉得其实没必要。真的搞的时候也都是调库,过程中保持敏感性,细致、观察很重要。当然有很多大佬他们全方位的强,比如我看到guidance、exllama这些一两个人开发的库,作者对数学原理的熟悉、以及极强的工程实现、性能优化能力让人叹为观止,让人心向往之,但是我又不是活不到明年了,也未必就不能至吧。至少试试呗,不行再说嘛。机会留给胆大的人,我是成功了,接下来看你自己了!

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型?

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术,如自然语言处理和图像识别,正在推动着人工智能的新发展阶段。通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。

大模型典型应用场景

AI+教育:智能教学助手和自动评分系统使个性化教育成为可能。通过AI分析学生的学习数据,提供量身定制的学习方案,提高学习效果。
AI+医疗:智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像,辅助医生进行早期诊断,同时根据患者数据制定个性化治疗方案。
AI+金融:智能投顾和风险管理系统帮助投资者做出更明智的决策,并实时监控金融市场,识别潜在风险。
AI+制造:智能制造和自动化工厂提高了生产效率和质量。通过AI技术,工厂可以实现设备预测性维护,减少停机时间。

AI+零售:智能推荐系统和库存管理优化了用户体验和运营成本。AI可以分析用户行为,提供个性化商品推荐,同时优化库存,减少浪费。

AI+交通:自动驾驶和智能交通管理提升了交通安全和效率。AI技术可以实现车辆自动驾驶,并优化交通信号控制,减少拥堵。


这些案例表明,学习大模型课程不仅能够提升个人技能,还能为企业带来实际效益,推动行业创新发展。

学习资料领取

如果你对大模型感兴趣,可以看看我整合并且整理成了一份AI大模型资料包,需要的小伙伴文末免费领取哦,无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

四、LLM面试题

在这里插入图片描述

如果二维码失效,可以点击下方链接,一样的哦
【CSDN大礼包】最新AI大模型资源包,这里全都有!无偿分享!!!

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

  • 4
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值