小米AI大模型要来了！_小米汽车ai大模型-CSDN博客

本文链接：https://blog.csdn.net/zzh516451964zzh/article/details/138949573

B站：啥都会一点的研究生
公众号：啥都会一点的研究生

AI圈最近又有啥大动静？

百度发布全球首个L4级自动驾驶大模型 Apollo ADFM

百度Apollo在武汉百度萝卜快跑汽车机器人智行谷举办Apollo Day 2024，发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM （Autonomous Driving Foundation Model）。百度称， Apollo ADFM基于大模型技术重构自动驾驶，可以兼顾技术的安全性和泛化性，做到安全性高于人类驾驶员10倍以上，实现城市级全域复杂场景覆盖

https://www.ithome.com/0/768/123.htm

小米 AI 大模型 MiLM 正式通过备案，将逐步应用于汽车/手机/智能家居等产品

小米大语言模型 MiLM 正式通过大模型备案，相关模型据称将逐步应用于小米汽车手机、智能家居等产品中，后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年8月首度现身C-EvalCMMLU 大模型评测榜单，当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1

https://www.ithome.com/0/768/333.htm

字节发布豆包大模型，比行业价格低99.3%

字节跳动豆包大模型在火山引擎原动力大会上正式发布。豆包大模型原名“云雀”，是国内首批通过算法备案的大模型之一。经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片

基于豆包大模型，字节跳动打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具。豆包主力模型在企业市场的定价只有0.0008元/千Tokens， 0.8厘就能处理1500多个汉字，比行业便宜99.3%

https://www.leiphone.com/category/ai/2grULrhwxoRnYs1G.html

腾讯宣布混元文生图大模型升级并对外开源

腾讯宣布旗下的混元文生图大模型升级并对外开源，目前该模型混元DiT （Hunyuan—DiT）已经在Hugging Face平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。升级后的混元文生图大模型采用了与Sora一致的DiT架构，不仅可支持文生图，也可作为视频等多模态视觉生成的基础。这也是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解，参数量15亿

https://www.jiemian.com/article/11168879.html

智源研究院发布国内外140余个大模型评估结果

智源研究院举办大模型评测发布会，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。引入海淀区教师进修学校新编小学三年级至高三学段，覆盖语数英物化史6个学科，总计45套试卷，1400道试题。综合各年级、各学科综合得分率，表现优异的前五名都是闭源大模型，分别是通义Qwen-vi-max、百度文心一言4.0、智谱华章GLM-4、百川智能Baichuan3、GPT-4。然而，在学科测验上，大模型略低于海淀各年级学生平均水平

https://www.jiemian.com/article/11186669.html

OpenAI发布GPT-4o，速度比 GPT-4 Turbo 快 2 倍，价格便宜 50%，速率限制为 5 倍

OpenAI 发布了其新的旗舰型号 GPT-4o（"o "代表 “omni”）。与 GPT-4 Turbo 相比，它能提供 GPT-4 级别的智能，但速度快 2 倍，价格便宜 50%，速率限制高 5 倍，并增强了文本、语音和视觉功能。在英语和代码文本方面的性能也与 GPT-4 Turbo 相当，在非英语语言文本方面也有显著改进。GPT-4o 可在 232 毫秒内响应音频输入，平均响应时间为 320 毫秒，与人在对话中的响应时间相近

https://openai.com/index/hello-gpt-4o/

TikTok 测试由 ChatGPT 加持的搜索结果

TikTok 正在测试一项新的搜索功能，该功能使用人工智能为某些查询生成结果。对于某些搜索词，如食谱或产品推荐，TikTok 将在搜索结果的顶部显示人工智能生成的答案。这些答案由 ChatGPT 提供支持，当点击其中一个人工智能结果时，它会带你进入一个包含完整回复的页面

https://www.theverge.com/2024/5/13/24155875/tiktok-ai-generated-search-results-highlights-chatgpt

谷歌对其AI生态系统进行一系列重磅更新，最新长文本模型问鼎全球

在谷歌I/0开发者大会主题演讲上，谷歌CEO桑达尔:皮查伊(Sundar Pichai)发布数十款Google和 AI 结合产品，堪称”全家桶”级别，全力对战OpenAl。

其中包括支持200万token长文本的Gemini 1.5 Pro和 Gemini 1.5 Flash、谷歌版Sora视频技术Veo，最强开源模型Gemma2，支持生成式搜索的Al Overviews、第六代TPU等。但最受关注的，还是谷歌DeepMind CEO、谷歌 Al负责人DemisHassabis公布的真正通向 AGI的万能助手项目Project Astra，以及语音NotebookLM，直接对标GPT-4o。这场110分钟演讲中，皮查伊提及 A1 的次数高达121次