目录
DeepSeek震动AI界
引发巨头关注与股价波动:中国的AI初创公司DeepSeek推出的DeepSeek-V3和DeepSeek-R1两款大模型,让硅谷震惊。1月24日,Alexander Wang表示DeepSeek在他们的测试里表现最好,与美国最好的模型相当。这引发了Meta内部的恐慌,工程师们开始连夜尝试复制其成果。同时,英伟达股价也因DeepSeek事件出现大幅波动。
各界高度评价:著名投资公司A16z的创始人马克·安德森称Deepseek-R1是令人惊叹的突破。A16z合伙人Anjney Midha表示,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。
阿里云通义千问更新
阿里云通义千问动作频频,先是在1月28日开源全新视觉模型qwen2.5-vl,推出3b、7b和72b三个尺寸版本,能更准确解析图像内容,支持超1小时的视频理解等操作。接着在1月29日凌晨,超大规模的moe模型qwen2.5-max上线,预训练数据超20万亿tokens,在多个基准测试中表现出色。
OpenAI新模型将至
据路透社1月20日消息,OpenAI的新推理AI模型“o3 mini”版本已完成,计划在几周内正式推出,并将发布API和ChatGPT的相关功能。
英伟达回应DeepSeek事件
1月30日,英伟达针对DeepSeek事件作出回应,肯定了DeepSeek在AI领域的进步,澄清出售的GPU芯片是合规的,还表示DeepSeek的模型仍需大量GPU进行推理,其技术突破可能会推动更多企业尝试AI开发,增加对GPU的需求。