回顾2024，国内AI卷麻了_superclue 排名 deepseek-CSDN博客

本文链接：https://blog.csdn.net/zzh516451964zzh/article/details/145075175

B站：啥都会一点的研究生
公众号：啥都会一点的研究生

AI科技圈又发生了啥新鲜事

商汤推出“日日新”融合大模型，勇夺“双冠王”

商汤科技近日推出“日日新”融合大模型，实现了原生融合模态，深度推理能力与多模态信息处理能力大幅提升。在SuperCLUE的《中文大模型基准测评2024年度报告》中，以总分68.3与DeepSeek V3并列国内榜首；在OpenCompass的多模态评测中，同样取得榜单第一，分数大幅领先GPT-4o。该模型在文科成绩上以81.8分位列全球第一，理科成绩也夺得金牌，其中计算维度以78.2分位列国内第一。其在实际应用场景中展现出显著优势，如自动驾驶、视频交互、办公教育等领域，能够满足用户对多源异构信息的综合处理与识别需求

在这里插入图片描述

https://mp.weixin.qq.com/s/kyx4_t6CpoHMM_6pW5-XEg

国家网信办：2024年末302款生成式人工智能服务完成备案

截至2024年12月31日，共有302款生成式人工智能服务在国家网信办完成备案，其中2024年新增备案238款。此外，通过API接口或其他方式调用已备案模型能力的生成式人工智能应用或功能，2024年有105款在地方网信办完成登记。已上线的相关应用或功能需在显著位置公示所使用的已备案或登记服务情况，包括模型名称、备案号或上线编号

https://www.ithome.com/0/823/347.htm

2024年AI搜索赛道：三大门派的激烈角逐

2024年，AI搜索成为科技领域的热点，众多企业纷纷布局。据光锥智能统计，目前独立AI搜索产品已超16个，涉及公司超14家，产品超23个。互联网巨头如腾讯、字节跳动、360等，纷纷推出AI搜索产品，如腾讯的ima、字节跳动的豆包电脑版、360的纳米搜索等。内容生产平台如小红书、B站等也试水AI搜索，推出站内相关产品。AI创业公司如秘塔AI等则专注于特定领域。AI搜索产品形态不断进化，从简单的搜索功能到融合多模态、跨场景的内容搜索和创作功能，未来有望成为集搜索、存储、整合、提炼、创作于一体的全能型智能助手

https://www.tmtpost.com/7412698.html

CES 2025：AI硬件落地，中国厂商大放异彩

CES 2025于1月7日开幕，AI成为绝对主角，中国厂商表现亮眼。涂鸦智能展示了AI技术与业务终端耦合模式，通过与大模型合作，为硬件开发者提供云端接入和直连模式。其AI技术应用广泛，如宠物喂养助手、健身加油小精灵等，还展示了智慧能源管理解决方案。AR/AI眼镜成为明星产品，雷神发布三款眼镜，Rokid Glasses受外媒好评。电视画质取得重大突破，海信发布RGB三维控色技术，TCL巩固Mini LED市场地位，长虹推出AI和超大尺寸电视。智能清洁领域，追觅首创机械手扫地机器人，MOVA推出履带式拖布扫地机器人，云鲸带来AI双目视觉感知技术和热活水循环清洁方案。整体来看，CES 2025更务实，中国厂商在AI硬件落地方面大放异彩

https://36kr.com/p/3114212090674944

中国信通院发布MaaS六大标准，助力AI模型落地

中国信通院为解决MaaS平台服务质量参差不齐、选型困难等问题，正式发布MaaS系列标准。该系列标准围绕大模型定制调优、服务部署和推理加速、模型管理、应用开发等维度，提出能力要求，为大模型服务商和平台供应商提供能力建设参考，为应用方提供技术选型依据。标准包括模型服务协议要求、模型服务评估方法、模型平台、模型服务平台、模型管理平台和模型应用开发平台六个部分。自2024年下半年启动评估以来，已完成科大讯飞等7家企业的部分模块首轮评估，新一轮评估持续进行中

https://www.ithome.com/0/822/794.htm

阿里云通义灵码AI程序员全面上线

阿里云和通义实验室联合推出的通义灵码AI程序员全面上线，成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员产品。该工具能力全面，通过全程对话协作方式，可完成从0到1的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。底层模型升级至Qwen2.5-coder，代码生成准确率及速度达世界前列。通义灵码还引入多文件代码修改能力，支持文件、图片、全工程代码检索等上下文和用户输入提示词自由组装，能更好地理解任务意图

https://mp.weixin.qq.com/s/swxdg_6c1O-h4vg1pqLGIA

昆仑万维「天工大模型4.0」o1版和4o版上线，免费开放使用

昆仑万维集团宣布「天工大模型4.0」o1版和4o版正式上线天工网页和APP，供用户免费使用。Skywork o1作为国内首款中文逻辑推理能力模型，经全方位技术升级，能熟练处理数学、代码、逻辑等推理挑战。Skywork 4o是昆仑万维自研的多模态模型，其赋能的实时语音对话助手Skyo具备情感表达和多语言切换能力，为用户带来流畅的对话体验。此次上线的模型在数学、代码和逻辑推理能力上显著提升，Skywork o1在相关基准测试中的表现逼近o1-mini，显著优于行业常规通用大模型

https://mp.weixin.qq.com/s/bSLAcicOIbj2BMPavlv4wg

科大讯飞发布办公智能体产品升级，打造办公新范式

科大讯飞于1月7日在北京中关村国际会议中心举办办公智能体产品升级发布会，推出多款办公智能体，赋能专业用户创新效能。此次发布的“知识中台、AI搜索、星火人设、虚拟数字人、星辰MaaS与多模交互”六大通用能力，为用户打造个性化AI助手。讯飞星火作为首个基于全国产算力训练的全民开放大模型，已通过大模型国家标准测试认证。发布会上，科大讯飞还展示了办公智能体矩阵与星火智能体平台，真机演示AI在办公中的应用。此外，讯飞星火深度推理模型X1计划于1月15日发布，将进一步拓展智慧办公边界

https://mp.weixin.qq.com/s/Sckl0QfqbEW_kQ5YviyLhg

微软开源140亿参数小语言AI模型Phi-4，性能媲美GPT-4o Mini

微软在Hugging Face平台上开源了小语言模型Phi-4，该模型参数量仅为140亿，却在多个基准测试中表现优异，甚至超越了参数量更大的Llama 3.3 70B和OpenAI的GPT-4o Mini。Phi-4的强悍性能主要归功于微软精选的高质量数据集进行训练。目前Phi-4尚未优化推理，未来开发者可进一步优化和量化，让其在个人电脑和笔记本电脑等设备上本地运行

https://www.ithome.com/0/823/482.htm

李开复谈零一万物调整：与阿里合作，专注小模型应用，收入超1亿

零一万物CEO李开复在与《晚点 LatePost》的对话中澄清了关于公司被收购的传闻，表示零一万物并未寻求被收购，而是与阿里云成立了“产业大模型联合实验室”，大部分训练和AI infra团队将加入该实验室。零一万物将不再追求训练超级大模型，而是专注于训练参数适中的更快、更便宜的模型，并基于这些模型打造盈利应用。李开复总结了中国大模型创业的挑战，包括芯片限制、融资额和估值低于美国公司、Scaling Law变慢等。他强调，零一万物将继续做预训练，但会放弃追寻AGI，转而聚焦于应用落地和商业化。2024年，零一万物的实际收入已超1亿元人民币，预计2025年将翻数倍

https://mp.weixin.qq.com/s/IUA482JlwI4CcRpiMRGHbA

智元机器人推出首个机器人4D世界模型EnerVerse，实现动作规划新突破

智元机器人团队提出了EnerVerse架构，通过自回归扩散模型，结合稀疏记忆机制与自由锚定视角（FAV），在生成未来具身空间的同时引导机器人完成复杂任务。实验结果显示，EnerVerse在短程与长程任务视频生成中均表现卓越，其单视角模型在LIBERO四类任务中的平均成功率已超过现有最佳方法，多视角设定进一步提升任务成功率。这一成果不仅突破了机器人任务规划的技术瓶颈，还为多模态、长程任务的研究提供了全新范式

https://mp.weixin.qq.com/s/MpScYqr_YluoScrJTNHSLQ

英伟达RTX 50系列显卡发布，RTX5090国行售价16499元起

在拉斯维加斯CES 2025展会上，英伟达CEO黄仁勋发布了RTX 50系列显卡，其中RTX5090拥有920亿晶体管、3352 AI TOPS的性能，支持新一代超分辨率DLSS 4技术，性能较RTX 4090提升2倍。RTX5090国行售价16499元起，RTX 5080为8299元起。此外，英伟达还推出了基于Llama的一系列模型和世界模型Cosmos平台，以及个人AI超级计算机Project DIGITS，旨在推动AI和物理AI系统的发展