大模型现状及行业落地趋势分析

1、大模型发展现状

以2022年底美国OpenAI公司发布ChatGPT产品为标志,AI技术从感知判别,向生成创造发展,以大模型为代表的AI技术发展迈向新阶段。2023年以来,如果IT圈里还有不知道大模型的,那么他一定是个IT菜鸟。国内几乎大部分科技公司、学术团体、研究机构、以及学生团队都在发布各自的大模型,国产大模型一时间呈现出遍地开花,井喷式发展状态。大模型突然从洛阳纸贵到了唾手可得,AI从业者从前几年几乎无人问津,突然变得炙手可热。根据一些公开资料,截止2023年底国内已经发布了近300个大模型,呈现“百模大战”乱局。

艾瑞咨询,2023年AIGC产业全景报告

2023年7月13日,中央网信办公布《生成式人工智能服务管理暂行办法》指导大模型产业发展,明确规定面向公众提供服务的大模型上线提供服务之前必须先履行备案。截至12月25号,中央网信办通过互联网媒体公布的已上线备案的大模型产品共有28家。

从发布大模型的厂商来说,大概可以分为三类:

第一类以大厂为主,如百度、阿里、腾讯、华为等,大厂资金雄厚,投入大量的资金采购算力、数据,闭门造大模型,如百度千帆大模型、阿里通义大模型、腾讯混元大模型等,大厂的大模型也是重点发力互联网市场。

第二类以创业公司为主,以百川智能、智谱AI等为代表,通过创始人影响力,以及敏锐商业和技术眼光,抓住大模型机会,募集大量融资重点投入,以开源等方式,迅速抢占市场,提升影响力。这类厂商当前重点以打磨基模型为主,通过开源产品提升影响力,募集资金,同时利用闭源产品发展合作生态,借助生态触达客户落地行业市场。

第三类以传统IT厂商为主,以浪潮、紫光、运营商等为代表,基于“开源大模型基座+迁移学习+微调”技术路线,这也是国内大部分发布大模型的厂商走的技术路线。传统IT厂商借助对行业客户的触达力、影响力,以及业务沉淀,开发行业大模型,重点解决行业智能化场景。这个方向,受限于国内外开源模型的能力制约,同时优质的行业数据资源成为影响模型性能的关键。

另外,当前中美人工智能领域的竞争越来越激烈,除了已经摆上台面的GPU算力压制外,美国免费开源大模型已经开始冲击国内专注于自主训练大模型的厂商。以Meta发布的Llama 2 为例,性能是超过GPT-3的,对国内许多闭门造大模型的公司是个巨大的打击,这个模型(Llama 2)将满足大多数公司对更低成本和个性化的需求。国内外已经开始慢慢形成一种共识,既大模型本身并不具备护城河,而是某个闭源或开源大模型上面形成的应用生态将是最大护城河。国内的一些人工智能项目的投资人,都表示目前已经不会再投“国产大模型”,大模型就是一堆代码,如果没有落地产业生态,意义不大。

2 、大模型的主要能力和问题

大模型区别于传统AI的核心能力在于其生成创造力。在互联网技术的推动下,原本分散在全球的知识变得易于获取,这不仅解决了知识难以触达的问题,还显著提高了知识传播的数量和效率。然而,这种知识传播仍停留在简单的搬运层面,仅仅发挥了类似人类手脚的功能,同时也导致了信息和知识的过度饱和。尽管电脑和手机中充满了海量知识,但人类用户往往难以真正吸收并为其所用。

大模型的出现改变了这一现状,它优化了人类与信息的互动方式。大模型在一定程度上承担了人类大脑的角色,帮助人们更快、更有效地吸收和理解知识。不仅如此,大模型还能将这些知识应用于实际场景中,创造出全新的内容,从而进一步提升知识传播的质量和效果。

根据布鲁姆教育目标分类法人类对知识的处理(Knowledge Processing)有六个层次:记忆、理解、应用、分析、评价和创造。大模型在这六层的知识处理中,都能发挥一定的作用,为人类大脑提供辅助。

大模型的生成创造能力存在两种极端表现。一方面,由于其训练的数据规模远超人类,大模型展现出强大的能力。它能够回答各种基于事实的问题,并展现出出色的记忆能力,覆盖广泛的知识领域。然而,另一方面,大模型也存在着所谓的幻觉问题。有时为了满足人类的预期,大模型可能会捏造不存在的事实。这主要是由于模型在处理信息时,对于某些模糊或不确定的情形,可能会产生错误的推理或生成不真实的内容。这种现象不仅可能导致误导,还可能对人们获取真实信息造成干扰。

除了大模型幻觉,大模型安全也是一个重要问题。安全问题有两个方面,一是数据安全风险,大模型需要大量的训练语料,这些语料特别是行业专属语料,由于存在隐私信息,存在数据泄露、恶意利用风险;二是内容合规风险,由于大模型在生成内容时具有很强的自主性和创造性,因此其生成的内容可能存在合规问题。具体来说,大模型可能无法准确判断某些词语或表达方式是否符合法律法规、社会道德和行业规范的要求,从而产生不合规甚至违法的内容。

3 、大模型落地行业趋势分析

大模型落地行业,必定是场景驱动,以场景带模型。从大模型应用方向上,按照大类,可以分为互联网行业、政企行业。

互联网行业对大模型有着强烈且天然的需求。在互联网行业中,对网络的要求通常是公开、透明和高度互联,而非私有化和隔离的,同时互联网行业的创业者们对产品开发通常要求低成本、快速迭代和创新,这为大模型的应用提供了广阔的舞台。以百度千帆大模型为例,其最大的应用生态就是互联网中小型企业,其大模型也为中小型企业提供了客服问答、文档分析、数据分析、办公助手、代码助手、网页浏览、创意营销、商品导购、教育问答等标准应用场景,便于中小型企业快速构建各类创新型的智能应用产品。

政企行业主要是指政府、大中型企业,他们对数据安全要求高,个性化需求多,服务要求高。对以提供标准产品与服务的通用大模型服务来说,是比较难落地。因此基于行业数据资源,采用“通用大模型基座+迁移学习+微调”构建行业大模型,成为大模型落地政企行业的主要路径,这也造成大模型落地成本较高的问题。

对于政府来说,从2023年下半年的尝试及观望状态,伴随着厂商的市场培育,以及自身存在希望从大量繁琐重复的工作中释放的需求,预测从2024年逐步开始进行大模型实施落地阶段。2023年底,安徽省大数据局发布了第一个省级数字政府大模型场景应用清单,拉开了将大模型等新技术应用到数字政府领域的序幕,接下来大模型将在政务咨询、辅助办理、城市治理、机关运行、辅助决策等方面提升服务智能化、精准化水平,提高政策制定的合理性、前瞻性,有效推进政府履职模式创新。同样在12月份广东省大数据局也发布《广东省加快数字政府领域通用人工智能应用工作方案》,预计在2024年将会有大量的省市级政府发布类似的大模型工作方案,各地政府以场景带模型、模型带产业发展的思路,必将在政府领域掀起一轮大模型应用高潮。

对于大中型企业来说,更是存在海量的需求,希望通过大模型来降低企业的经营成本。企业对大模型的需求主要是两个方面,一是经营管理,具备一定规模的企业,大部分已经建设了OA、ERP、CRM、财务、HR、PLM等系统,具备了大量的运营数据,如何更好的利用这些运营数据,助力企业决策者们进行科学、高效的决策,是大模型赋能企业经营管理的一个重要方向;二是生产管理,大中型企业的生产线已经基本实现自动化、乃至智能化,生产线运行过程中产生的数据,如何通过大模型对这些数据进行分析和处理,提高生产效率和产品质量,是所有企业决策者关注的问题,也是生产线智能化改造的重要表现。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值