今天分享的是人工智能系列深度研究报告:《人工智能专题:2024人工智能大模型的技术岗位与能力培养研究报告》。
(报告出品方:广发证券)
报告共计:43页
来源:人工智能学派
大模型的概念与发展过程
ChatGPT(全名:Chat Generative Pre-trained Transformer),是美国 OpenAI 研发的聊天机器人程序 ,于 2022 年 11 月 30 日发布 。发布后迅速 引起了社会、产业与技术界对于大模型与人工智能的发展与应用的新热潮。 作为世界上首款正式开发的大数据模型,ChatGPT 给大家带来了前所未有的 冲击和影响。
参考 IDC 发布的《2022 中国大模型发展白皮书》中对于大模型的定义,以及 针对大模型相关的研究与概念界定,教培分会对大模型得出以下理解,AI 大模 型是一种基于海量多源数据打造的预训练模型,通过对原有算法模型的技术升级 和产品迭代,用户可以通过开源或开放 API/工具等形式进行模型零样本/小样本 数据学习,从而实现更优的识别、理解、决策和生成效果,同时也降低了开发部 署的成本。
大模型的核心作用在于突破数据标注的困境。通过学习海量无标注的数据进行预训练,大模型拓展了整体模型前期学习的广度和深度,从而提升了大模型的知识水平。这种方式使得大模型能够在后续下游任务中以低成本且高适应性的方式发挥应用价值。
在实践中,大模型首先通过基于海量数据的自监督学习阶段完成了“通识”教育。接着,通过“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特