金融行业大模型应用技术路径：通用大模型VS金融垂类大模型【金融大模型系列】

最新推荐文章于 2025-03-23 16:43:45 发布

大靠山

最新推荐文章于 2025-03-23 16:43:45 发布

阅读量659

点赞数 5

文章标签：金融人工智能深度学习 AIGC AI技术

本文链接：https://blog.csdn.net/m0_59235245/article/details/139102328

版权

当前AI与金融的结合主要有两条技术路径：一是通用模型+金融语料微调大模型，二是预训练成金融垂类大模型。由于设计和训练目的不同，通用语言大模型与金融垂类模型在优劣上具有相对性。预训练是预先训练模型的过程，微调是将预训练过后的模型作用于自己的专业数据集；从海外实践情况来看，目前国外成功的预训练金融垂类模型主要BloombergGPT，其他公司为节省成本，采用通用大模型+特定领域数据微调方式的较多，对于国内多数公司而言，在算力资源的限制下，后者的可行性更高，但前者综合效果更好。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势，而在专业性、针对性、高精度和合规性上，金融垂类模型更胜一筹；在复杂度问题上，通用语言大模型在结构上更加复杂，影响模型效率，而金融垂类模型则是在更新维护上具有复杂性。

	预训练金融垂类大模型	通用大模型微调
通用性	金融领域表现较好，在其他领域不具有泛化性	具有更好的通用性，但在金融领域需要微调适应特定任务
适应性	模型更适应金融领域的术语、语境和任务	底层通用大模型需要额外的微调以适应金融领域
数据需求	需要大量金融领域数据进行预训练，数据质量对模型性能影响较大	可以在较小的数据集上进行微调
任务复杂度	对于需要金融专业知识的复杂任务更有优势，提供更精准的信息	对于相对通用的任务，通用预训练+微调可能更为适用，但通用大模型复杂，模型计算量大影响性能
迭代速度	金融政策更新较快，金融领域预训练涉及大量数据收集、清洗和标注，过程相对耗时，迭代速度较慢	迭代较快，在面对快速变化的行业更具有灵活性和适应性
资源和成本	需要更多的金融专有数据。计算资源和时间，成本相对较高	成本相对较低，底层通用大模型已经在大规模通用数据上进行了训练

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述