中国现有人工智能大模型体验报告

最新推荐文章于 2024-07-09 08:44:41 发布

IT小哥哥呀

最新推荐文章于 2024-07-09 08:44:41 发布

阅读量1k

点赞数 27

文章标签：人工智能语言模型 gpt 大数据自然语言处理 ai AIGC

本文链接：https://blog.csdn.net/xu11410/article/details/136674885

版权

本文分析了中国大模型的发展现状，如科大讯飞、百度、商汤、智谱AI等厂商的表现，强调了大模型在基础能力、语言理解、AI向善、跨模态对话和情商等方面的发展与挑战。同时，文章讨论了大模型的商业化应用、安全性、工具效率提升以及未来发展方向，指出大模型将成为AI大规模落地的关键点。

摘要由CSDN通过智能技术生成

前言

当前中国大模型产品进步显著，但与接受过高等教育的人类相比，大模型在智商、情商等方面还存在一定程度差距。具体来看，科大讯飞的星火在工作提效方面优势明显；百度文心一言地基深厚、基础能力仍处领军水准；商汤商量则在情商方面表现优秀；智谱AI 的ChatGLM整体表现优秀。在本次体验测评的基础上，研究团队将继续深耕，加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究。

01.大模型成为AI大规模落地拐点

中国大模型发展热度依旧，天眼查数据显示，截至2023年上半年，与“大模型”直接相关的融资事件超20起，其中包含光年之外、面壁智能等明星级创业企业；从被投企业的地域分布来看，北京、上海以及杭州位居前列，特别是北京，融资事件数量超10起，凸显出北京在人工智能领域的领先地位。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合，实现真正的商业化应用。具体来说探索主要围绕研究层面和应用层面：
研究层面，中国大模型在科研方面已形成涵盖理论、方法、软硬件的体系化能力，学术界和产业界共同参与，形成更加完善的理论框架。
应用层面，目前大模型已开始渗透到各行各业，实现商业化应用。超过半数的大模型实现开源。

在这里插入图片描述
AI技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展，AI大规模落地需要更多时间来验证。通过降低成本、提高易用性、增强可靠性、保护隐私和安全等方面的措施，可以进一步提高大模型的可用性，让更多的人受益于AI技术的发展，实现更加智能化和便捷化的生活。
在这里插入图片描述
未来已来，大模型概念红利逐渐消失，回归到实际应用。

02.大模型厂商整体测评

在这里插入图片描述
解析：
首先，在基础能力方面，人类与AI之间的差距并不显著。这是因为AI算法模型的开发受到人类编程思维
的影响，并且在其开发过程中充分利用了人类的智慧和知识。在政策的积极引导下，AI在向善和语言能力上表现出色，逐渐接近人类专家的水平。值得关注的是，大模型的安全可解释性需要持续投入，避免不受控制的现象出现。
尽管AI在某些方面能够达到或超过人类的水平，但在整体上，人类在智商方面仍然具有明显优势。人类的智商不仅体现在学习能力上，更表现在善用工具和解决问题的能力上。尽管一个人不可能在所有领域都精通，但通过互联网等渠道获取各方面的信息，进行总结、积累和归纳，从而形成个人知识体系，这是人类智商的一个重要表现。因此，在智商评估中，人类的分数达到最高。
在情商方面，AI与人类之间的差距最为明显。目前尚未观察到AI具备情绪感知能力的明显迹象。相比之下，人类在情绪理解和处理方面通常具有更强的优势和更灵活的处理能力。人类的情感智慧是人类智能的重要组成部分，它涉及到人类的高级认知和社交能力，AI需要进一步发展感知智能。最后，在工具效率提升方面，AI对人类提供了有力的支持，AI的处理速度远远超过人类。然而，尽管AI具有高速度和高效率的优势，但在某些复
杂和具有创新性的任务中，人类的智慧和想象力仍然具有无法替代的作用。
整体上看，AI大模型的发展为人类工作和生活的提质增效均带来了正向的积极影响。
在这里插入图片描述

解析：
大模型的基础能力包括多个方面，其中最重要的是语言能力。语言是人类智慧的体现，也是人工智能系统需要理解和模仿的重要领域。大模型通过学习和训练，可以理解和生成自然语言文本，并且可以进行多语言翻译和多语言对话。这些语言能力可以帮助大模型在自然语言处理、人机交互、智能客服等领域发挥重要作用。
除了语言能力，大模型还具有AI向善的能力。AI向善是指人工智能系统在运行过程中，能够遵循道德和伦理原则，保障人类的利益和安全。大模型在设计和训练时已经融入了这些原则，因此可以保障在应用时遵循AI向善的理念。
大模型还具有跨模态和多轮对话能力。跨模态是指在不同模态之间进行转换和迁移，例如将图像转换为文字描述，或者将语音转换为文字。这些能力可以帮助大模型在自动驾驶、智能家居等领域应用时更好地理解和处理不同模态的信息。多轮对话能力则是指大模型可以在多个对话回合中保持连续性和逻辑性，从而完成更复杂的任务和问题解答。
权重占比：语言能力（35%）、AI向善（10%）、跨模态（20%）、多轮对话（35%）
在这里插入图片描述
解析：
大模型的情商考察是指对其在情感和人际交往方面的表现进行评估，其中包括日常尴尬事项的反馈、面对一语双关问题的处理以及人际关系相处难题等方面，包括与朋友、家人、同事等在各种场景下的交往问题。
具体来说，日常尴尬事项的反馈是指大模型在处理一些尴尬或者棘手的问题时，能否给出合适的回答或者解决方案。例如，当被人问到一些私人或者敏感的问题时，大模型需要具备足够的情商和应变能力，避免造成不必要的尴尬和误解。由于中国语言博大精深，在日常沟通交流过程中常常有一语双关的情况出现，需要大模型理解并应对实际问题，通过敏锐的洞察力、判断力以及感知能力等，准确地理解当下环境和词语意思。另一方面，人际关系相处难题是指大模型在与人类进行交互时，能否帮助人类处理好各种人际关系问题，例如与他人的冲突解决、情感交流、同理心表达等等。这些问题的处理需要大模型具备高超的人际交往能力和情商，以建立和维护良好的人际关系。权重占比：日常事项（35%）、一语双（30%）、人际关系（35%）
在这里插入图片描述
解析：
大模型的工作提效考察通常包括两个方面：工具和创新。
工具提效是指大模型是否能够提供有效的工具来提高工作效率。这些工具可以包括代码自动生成、数据自动分析和可视化工具、自然语言处理、文件整理、关键内容总结整合和机器翻译工具等。具备这些工具的大模型可以帮助人们更快地完成工作任务，提高工作效率，也是大模型最先落地的方向之一。生成创新方面是指大模型是否能够提供新的思路和方法，推动工作方式的改进和升级。这些创新可以包括新的业务流程、选题的创新、内容的创新等。AIGC 能力能够帮助人们打破传统的工作方式，推动工作效率提升。权重占比：工具提效（50%）、生成创新（50%）

03.厂商优秀答案展示

科大讯飞-星火

“讯飞星火认知大模型”是科大讯飞推出的新一代认知智能大模型，具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

最佳案例展示
在这里插入图片描述

百度-文心一言

文心一言是百度打造出的人工智能大语言模型，具备跨模态、跨语言的深度语义理解与生成能力，文心一言有五大能力，包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。
在这里插入图片描述

商汤-商量

商汤科技以“坚持原创，让AI引领人类进步”为使命，是第一家将人脸支付技术集成至地铁售票系统中的公司，北京大兴国际机场正式投运由商汤科技AI技术支持的58套“智能旅客安检系统”，为全球旅客提供服务
在这里插入图片描述

智谱AI-ChatGLM

智谱AI是由清华大学计算机系技术成果转化而来的公司，致力于打造新一代认知智能通用模型。智谱提出全新 Model as a Service (MaaS) 的市场理念，打造了认知大模型平台以及数字人和科技情报产品。
在这里插入图片描述

360-360智脑

360公司主营360安全卫士，是中国领先的互联网安全软件与互联网服务公司。“360智脑”为360自研千亿参数大语言模型，周鸿祎表示360将坚持“两翼齐飞”大模型战略，一方面坚持自研核心技术，一方面通过大模型在城市、政府和企业端的布局和落地，进一步服务产业数字化和智能化。
在这里插入图片描述

昆仑万维-天工

昆仑万维是中国领先的互联网平台出海企业，深耕海外市场十余载。“天工”大模型是由昆仑万维主导研发的双千亿级大语言模型。目前“天工”最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平。
在这里插入图片描述

阿里-通义千问

阿里通义大模型是阿里云推出的超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持，是阿里云在人工智能领域的重要成果之一。在多个领域都得到了广泛的应用，为业务提供了强大的基础框架和工具，推动了人工智能技术的发展和应用。
在这里插入图片描述

澜舟科技-MChat

澜舟科技成立于2021年6月，是由创新工场孵化的一家从事 AI 2.0 大模型研发的认知智能公司。它致力于以自然语言处理（NLP）技术为基础，提供新一代认知智能平台。其主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用。
在这里插入图片描述

总结

经过近几年的发展，大模型正在加速走进生活，走进产业。以往AI 模型针对不同场景往往需要重复开发，导致效率低下。大模型的出现为这一挑战提供了新的解决思路，将加速推动产业向全链路智能发展。
国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布的《生成式人工智能服务管理暂行办法》进一步为大模型发展指明了方向。国家将坚持发展和安全并重、促进创新和依法治理相结合的原则，采取有效措施鼓励生成式人工智能创新发展。
在政府、企业和社会各方的共同努力下，中国大模型的产业生态已经初步形成。面向未来，各大厂商应更好地发挥各自优势。头部厂商继续发力自研大模型，而专注于解决方案的行业厂商可以考虑通过深耕垂类来彰显特色。此外，头部企业应该通过开放平台等方式对外赋能，促进大模型技术的共享和创新，加速其落地和推广，承担起技术发展的社会责任。
大模型+行业的发展将发挥越来越重要的作用。目前大模型在金融、工业、医疗等领域已经取得了显著成果，持续探索如何为行业领域提供更精准、高效的解决方案成为大模型厂商弯道超车的机会，未来通过新一代AI能够打造其独特的竞争优势。只有通过各方的共同努力和合作，才能够推动中国大模型技术的应用落地，最终实现人工智能产业的快速发展和跨越式进步。

IT小哥哥呀

关注

27
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
中国现有人工智能大模型体验报告

中国大模型发展热度依旧，天眼查数据显示，截至2023年上半年，与“大模型”直接相关的融资事件超20起，其中包含光年之外、面壁智能等明星级创业企业；从被投企业的地域分布来看，北京、上海以及杭州位居前列，特别是北京，融资事件数量超10起，凸显出北京在人工智能领域的领先地位。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合，实现真正的商业化应用
复制链接

扫一扫