技术的价值在于应用,理论与实践相结合才能事半功倍

学习大模型的三个方向

很多人学习人工智能技术就一心扑在技术上,认为自己把技术学好了就一定能找到工作,一定能成为公司技术部核心成员;但大家要明白的一个事实是,技术是为业务服务的,技术的作用是解决业务问题,而不是搞学术研究。

学习大模型技术,个人认为有三个方向:

1. 大模型基础技术大牛

说白了就是数学大牛,大模型技术本质就是一个数学模型,因此需要做这个方向的技术人员更多的是数学专业的大牛;比如说微分,概率,线性代数等。

他们的作用是设计更好的机器学习算法和打造更好的技术学习模型,比如怎么设计一个更好的神经网络,怎么设计更好的损失函数,怎么优化反向传播算法等。

这种工作更加偏向于底层技术和学术研究,而且这种人才待遇好,要求高,基本上不是名牌大学毕业的很难参与进来。

2. 大模型“运维”人员

之所以说是“运维”人员,是这个方向需要做的就是根据企业的业务需求,找到合适的商业或开源模型,然后能够收集和处理训练数据,然后完成模型的训练,部署和升级等任务;能够熟练使用不同的模型和工具处理不同领域的问题。因为他们特别像传统的服务器维护人员,因此叫大模型“运维”。

这个技术方向就需要懂得大模型的基础理论,并且有很强的实操能力,然后有充足的业务经验,能够把大模型和业务场景相结合,因此这个更看重的是经验和实操,反而技术要求并不高,重要的是能够熟练使用各种工具。

3. 大模型上层应用构建

再一个方向就是基于大模型构建上层应用,这个方向更像是一个传统的技术开发者,不需要了解大模型的运作原理,只需要能使用大模型的功能文档和接口文档即可,如果能懂一些大模型的理论就更好不过了。

4. 建议

对大部分人来说,选择后两种方式比较好,最好是能把后两种方向结合起来。因为研究大模型基础技术的成本太高,绝大部分企业都没有足够的资金和技术来实现,因此其就业的压力和竞争力可想而知。

其次,后两个方向只需要有一定的经验和学习能力就可以做到,甚至很多程序员可以直接转行成为第三种大模型应用开发者。

所以,对大部分人来说,最好的选择就是搞大模型应用,门槛相对较低,前景广阔。

因此,对个人来说一定要弄清楚自己的定位,否则就会导致自己没有努力的方向;然后这个也想学,那个也想学,最后什么都会又什么都不会。