大模型微调训练营毕业总结

RocWay007

于 2024-09-04 12:47:38 发布

阅读量299

点赞数 2

文章标签：大模型

本文链接：https://blog.csdn.net/pc_fly/article/details/141890450

版权

我目前在一家零售公司从事大数据架构方面的工作。

之所以选择参加AI大模型微调训练营，主要是考虑到当前无论是大数据这条技术赛道，还是个人职业发展都处在平台期，短期内看不到突破点。所以想看看在大模型这个技术领域有没有可能有所突破。大数据经过多年的发展，在理论和技术层面都已经到达了一个比较成熟的高度，用户使用也属于普惠期。不仅仅有支持度良好的商业化的产品，而且开源系统也能满足用户的基本使用。另外经过这么多年的发展，大数据这条赛道已经比较拥挤，个人要想有所突破不是太容易。

反观现在大模型领域，由于比较新，所以还有很多可能性。虽然在大数据架构这个技术领域内大模型不能完全取代人工，但是在实际工作中已经有很多部分大模型可以发挥重要作用。比如各种知识点的讲解、架构选型、疑难解答，甚至是一些编程工作都可以由大模型代劳。另外，大模型也有可能成为大数据架构中的一环。比如根据自然语言生成数据加工、即席查询任务等。甚至运维工作也可以采用大模型。

经过上述的深思熟虑后我决定学习大模型。在比对了市场上的一些培训课后，还是觉得极客时间的训练营性价比比较高。有一些平台的课程看上去比较综合，但细究课程表，更多的是偏向应用，如提示词工程、AIGC等。极客时间的训练营相对比较深入，尤其是在原理方面讲得比较透，适合喜欢追根究底的人。

参加课程后才发现之前就听过彭靖田老师的Tensorflow课，一如既往的逻辑清晰、知识广博。在彭老师的带领下迅速对大模型领域有了比较深入的了解，也逐步掌握了大模型的使用和微调技术。从茫然不知所措，到能够熟练应用，甚至有一些创新性的想法。现在在我的提议下，公司已准备在两个方面探索大模型的应用，一个是之前提到过的根据自然语言生成数据加工任务、即席查询；另一个是用AI辅助员工培训。这两个项目都受到了公司领导的重视。

现在课程结束了，我也想对平台提一点小建议：模型微调工作相对比较范式化，咱们的毕业作业是否可以整合这些工作成一个系统？现在有些大厂就提供了这样的系统。让用户提供数据、指定微调方法等，即可开始微调模型。甚至这都有一个约定俗成的名称：炼丹。