
AI科技圈最近又发生了啥新鲜事?
华强北:AI硬件的爆发地与实验场
华强北,这个曾经的“类苹果”产品聚集地,如今正被AI包围。从AI翻译机到AI吉他,再到AI手机壳和人形机器人,AI已成为华强北的新潮流。这里的商家不仅提供硬件,还愿意与AI开发者合作,将软件注入硬件中,创造出新的产品形态。华强北不仅是一个硬件备选池,更是AI软件开发者的天堂,等待着合适的软件来激活这些硬件。在这里,AI硬件的爆发和实验同时进行,华强北正以一种接地气的方式拆解和探索AI的未来可能性
https://mp.weixin.qq.com/s/3-UhnaC5ccKfu9Ahkgxaug
小马智行纳斯达克上市,募资4.52亿美元成Robotaxi第一股
自动驾驶技术公司小马智行(Pony.ai)在纳斯达克成功挂牌上市,股票代码为“PONY”,成为全球Robotaxi领域的第一股。公司通过IPO和私募配售共募资约4.52亿美元,其中IPO融资额可达2.99亿美元,若超额配售权行使则发行2300万股ADS,每股定价13美元。小马智行自2018年推出Robotaxi服务以来,已在全球累积近4000万公里的自动驾驶路测里程,其中包括400万公里的无人化里程,并与多家车企及出行平台建立了合作关系
https://mp.weixin.qq.com/s/T6iRLPjdEs9MmgCrUn5SfA
吴恩达开源Python包aisuite:统一接口调用多个AI模型
AI领域知名学者吴恩达发布了一个名为aisuite的开源Python包,旨在简化开发者调用不同AI模型的过程。这个工具通过统一接口设计,使得开发者能够轻松切换和测试来自OpenAI、Anthropic、Google等多个AI提供商的大型语言模型(LLM)。aisuite基于Python客户端库构建,支持聊天补全功能,并计划扩展到更多使用场景。目前支持的AI提供商包括OpenAI、Anthropic、Azure、Google、AWS等
https://mp.weixin.qq.com/s/MAqUaoue4Bqt5kuxVsXRYQ
Kimi联合清华大学等发布开源大模型推理架构Mooncake
北京月之暗面科技有限公司联合清华大学MADSys实验室及其他产学研机构,共同发布了开源项目Mooncake,旨在构建以KVCache为中心的大模型推理架构。Mooncake通过以存换算的创新理念,显著减少算力开销,提升推理吞吐量。项目已在GitHub开源,将逐步开源高性能KVCache多级缓存Mooncake Store的实现,并兼容各类推理引擎和底层存储/传输资源
https://mp.weixin.qq.com/s/NsKDtC7qp2JxA_EunwSqvg
Kimi数学版:AI推理与数学能力的新高度
Kimi数学版,一款采用Self-play RL强化学习和Cot思维链技术的AI模型,以其卓越的数学问题解决和推理能力脱颖而出。能够模拟人类的思考过程,尤其在解决数学问题上表现出色,智力程度可比博士。在实际测试中,Kimi数学版不仅准确回答了自媒体博主粉丝增长的问题,还正确处理了复杂的数学和推理问题,如统计特定字符出现次数和解决机械传动问题。此外,它还能理解用户的模糊表达,并进行推理或运算,显示出在日常应用中的实用性。Kimi在MATH测试中得分93.8分,超越了o1-mini和o1-preview,展现了中国AI在数学推理领域的领先地位
https://mp.weixin.qq.com/s/yuRCeyhIO8lHgVHkvWYdKw
腾讯混元大模型将上线视频生成能力并开源
腾讯宣布其混元大模型将于12月3日上线视频生成功能,用户可通过腾讯元宝App申请试用,企业客户可通过腾讯云接入。同时,腾讯将开源这一拥有130亿参数的视频生成大模型。此前,腾讯混元Turbo大模型已发布,采用MoE架构,推理效率提升100%,成本降低50%,价格比混元Pro降低50%,输出价格为0.05元/千tokens,输入价格为0.015元/千tokens
https://www.ithome.com/0/813/996.htm
昆仑大模型升级至700亿参数,中国石油人工智能领域再进一步
中国石油与中国移动、华为、科大讯飞合作,成功升级昆仑大模型至700亿参数,展示了43个专业和通用应用创新场景。该模型在自然语言处理、语音视觉识别等方面能力大幅提升,构建了我国首个勘探全领域专业大模型,并按需构建了21个场景大模型。此外,中国石油构建了超过280TB的高质量数据集,并形成了“1+4+N”大模型架构体系,推动人工智能赋能产业升级
https://mp.weixin.qq.com/s/NRqXIukR0DU7p21xFflimg
ChatExcel Pro使用教程发布,AI Excel助力高效数据处理
北京元空智能科技有限公司推出的ChatExcel Pro使用教程正式上线,该教程包含练习表格和提示词,旨在3分钟内教会用户使用AI Excel解决各类表格问题。ChatExcel Pro支持Excel处理、数据运算、数据分析和图表生成,覆盖多表合并、数据清洗、多条件数据运算等功能,显著提升数据处理速度。此外,ChatExcel Pro还提供行业专题样例演示,适用于HR、财务、市场等多个场景,助力用户通过自然语言描述完成复杂的数据处理任务。ChatExcel已获得千万级用户的喜爱,在AI Excel领域遥遥领先
https://mp.weixin.qq.com/s/9kyrWyWgH1Wkwt_KiK86Eg
英伟达发布音乐生成AI模型Fugatto:音频领域的“瑞士军刀”
英伟达推出了一款名为Fugatto的音乐生成AI模型,被形容为全球最灵活的声音机器,能够精细化控制声音生成。Fugatto不仅能够创作音乐、修改声音,还能混合音乐、人声和音效,甚至创造出前所未有的声音效果。用户只需提供文字描述或音频样本,Fugatto便能生成相应的音乐片段、音效,并能根据描述改变人声的口音和情感。对于音乐艺术家而言,Fugatto还能分离歌曲中的主唱、添加乐器,甚至将钢琴声替换成歌剧演唱,随意改编音乐旋律,为音乐创作带来革命性的便利
https://www.ithome.com/0/813/295.htm
Hugging Face发布20亿参数AI视觉语言模型SmolVLM
Hugging Face平台推出了一款名为SmolVLM的AI视觉语言模型,该模型仅含20亿参数,专为设备端推理设计,以体积小、速度快和内存高效著称。SmolVLM包括三个版本:Base、Synthetic和Instruct,分别用于下游微调、基于合成数据微调和指令微调。该模型借鉴了Idefics3架构,使用SmolLM2 1.7B作为语言主干,通过像素混洗策略将视觉信息压缩率提高至9倍。在多个基准测试中,SmolVLM的预填充吞吐量比Qwen2-VL快3.3到4.5倍,生成吞吐量快7.5到16倍,显著提升了处理速度
https://www.ithome.com/0/813/591.htm
昆仑万维发布“天工大模型4.0”o1版,国产AI推理能力迈入新阶段
昆仑万维推出的“天工大模型4.0”o1版(Skywork o1)标志着国内首款具备中文逻辑推理能力的大模型的诞生。该系列模型包括开源版本Skywork o1 Open(参数为8B),在数学和代码指标上显著提升,超越了Qwen-2.5-7B instruct,并解锁了GPT-4o等更大量级模型无法完成的数学推理任务。此外,昆仑万维还开源了两个Process-Reward-Model(PRM),Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B,后者在大部分基准上接近甚至超越了10倍量级的Qwen2.5-Math-RM-72B。Skywork o1系列模型展现了在逻辑推理、数学问题解决等方面的卓越能力,预示着国产AI技术在推理领域的重大突破
https://mp.weixin.qq.com/s/iJo7Pc648nvY21dW2-uEuQ
上海AI实验室推出强推理模型InternThinker,探索通专融合新进展
上海人工智能实验室展示了具备自主生成高智力密度数据和元动作思考能力的强推理模型InternThinker,并开放试用体验。该模型通过长思维能力和自我反思,在数学、代码、推理谜题等复杂任务上表现出色。InternThinker采用了元动作思考范式,引导模型高效习得多样化推理策略,显著提升了模型的学习效率和复杂任务处理性能。上海AI实验室将继续沿着通专融合发展路径,推动技术进步
https://mp.weixin.qq.com/s/1Bmn2sRmNMwVsp-XDzhWig
Claude变身服务器,AI编程新时代来临
Anthropic的Claude AI现在能够直连GitHub,自主完成代码编写、仓库创建、代码推送等一系列开发任务,大大减少了人类程序员的工作量。Claude的新能力基于MCP(Model Context Protocol)通信协议,旨在实现大模型应用与外部数据源和工具的无缝集成。Anthropic计划将MCP推动成为行业开放标准,目前已有合作伙伴如Replit等AI编程工具表示支持。这一进展标志着AI在编程领域的应用迈入了一个新的阶段,预示着未来程序员可能更多地扮演产品经理的角色
https://mp.weixin.qq.com/s/UXb0KyDCSHkUS_4dCGlsfQ