
AI圈最近又有啥大动静?
百度发布全球首个L4级自动驾驶大模型 Apollo ADFM
百度Apollo在武汉百度萝卜快跑汽车机器人智行谷举办Apollo Day 2024,发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM (Autonomous Driving Foundation Model) 。百度称, Apollo ADFM基于大模型技术重构自动驾驶,可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上,实现城市级全域复杂场景覆盖
https://www.ithome.com/0/768/123.htm
小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车/手机/智能家居等产品
小米大语言模型 MiLM 正式通过大模型备案,相关模型据称将逐步应用于小米汽车手机、智能家居等产品中,后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年8月首度现身C-EvalCMMLU 大模型评测榜单,当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1
https://www.ithome.com/0/768/333.htm
字节发布豆包大模型,比行业价格低99.3%
字节跳动豆包大模型在火山引擎原动力大会上正式发布。豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片
基于豆包大模型,字节跳动打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具。豆包主力模型在企业市场的定价只有0.0008元/千Tokens, 0.8厘就能处理1500多个汉字,比行业便宜99.3%
https://www.leiphone.com/category/ai/2grULrhwxoRnYs1G.html
腾讯宣布混元文生图大模型升级并对外开源
腾讯宣布旗下的混元文生图大模型升级并对外开源,目前该模型混元DiT (Hunyuan—DiT)已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。这也是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿
https://www.jiemian.com/article/11168879.html
智源研究院发布国内外140余个大模型评估结果
智源研究院举办大模型评测发布会,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。引入海淀区教师进修学校新编小学三年级至高三学段,覆盖语数英物化史6个学科,总计45套试卷,1400道试题。综合各年级、各学科综合得分率,表现优异的前五名都是闭源大模型,分别是通义Qwen-vi-max、百度文心一言4.0、智谱华章GLM-4、百川智能Baichuan3、GPT-4。然而,在学科测验上,大模型略低于海淀各年级学生平均水平
https://www.jiemian.com/article/11186669.html
OpenAI发布GPT-4o,速度比 GPT-4 Turbo 快 2 倍,价格便宜 50%,速率限制为 5 倍
OpenAI 发布了其新的旗舰型号 GPT-4o("o "代表 “omni”)。与 GPT-4 Turbo 相比,它能提供 GPT-4 级别的智能,但速度快 2 倍,价格便宜 50%,速率限制高 5 倍,并增强了文本、语音和视觉功能。在英语和代码文本方面的性能也与 GPT-4 Turbo 相当,在非英语语言文本方面也有显著改进。GPT-4o 可在 232 毫秒内响应音频输入,平均响应时间为 320 毫秒,与人在对话中的响应时间相近
https://openai.com/index/hello-gpt-4o/
TikTok 测试由 ChatGPT 加持的搜索结果
TikTok 正在测试一项新的搜索功能,该功能使用人工智能为某些查询生成结果。对于某些搜索词,如食谱或产品推荐,TikTok 将在搜索结果的顶部显示人工智能生成的答案。这些答案由 ChatGPT 提供支持,当点击其中一个人工智能结果时,它会带你进入一个包含完整回复的页面
https://www.theverge.com/2024/5/13/24155875/tiktok-ai-generated-search-results-highlights-chatgpt
谷歌对其AI生态系统进行一系列重磅更新,最新长文本模型问鼎全球
在谷歌I/0开发者大会主题演讲上,谷歌CEO桑达尔:皮查伊(Sundar Pichai)发布数十款Google和 AI 结合产品,堪称”全家桶”级别,全力对战OpenAl。
其中包括支持200万token长文本的Gemini 1.5 Pro和 Gemini 1.5 Flash、谷歌版Sora视频技术Veo,最强开源模型Gemma2,支持生成式搜索的Al Overviews、第六代TPU等。但最受关注的,还是谷歌DeepMind CEO、谷歌 Al负责人DemisHassabis公布的真正通向 AGI的万能助手项目Project Astra,以及语音NotebookLM,直接对标GPT-4o。这场110分钟演讲中,皮查伊提及 A1 的次数高达121次
https://techcrunch.com/2024/05/14/google-i-o-2024-everything-announced-so-far/