本帖调研截止至2025年3月,围绕通用型、办公类、视频类、绘画类、编程类五个常见AI产品的角度开展,重点放在2025年左右有新进展的产品上。
调研不保证全面,后续有关注到的产品会继续补充,希望能为大家提供帮助。
一、 AI 通用类产品
类型 | AI产品 | 发布时间 | 亮点总结 |
AI 通用类产品 | OpenAI GPT-4.5 | 2025年2月27日 | OpenAI推出的最大模型,用于文案撰写、编程辅助、知识问答等 |
智谱GLM-4 | 2025年2月10日 | 支持2小时的长视频理解能力和更加精细的短视频理解能力 | |
月之暗面 Kimi k1.5 | 2025年1月20日 | 多模态思考模型,用于数学、代码、多模态推理 | |
迅飞星火 X1 | 2025年1月15日 | 推理思考模型,支持语音同传 | |
MiniMax-01系列 | 2025年1月15日 | 包含基础语言模型和视觉多模态模型,采用混合专家MOE架构,支持超长上下文处理 | |
DeepSeek-R1 | 2025年1月20日 | 提升推理能力,支持复杂任务处理 |
二、 AI办公类产品
类型 | AI产品 | 发布时间 | 亮点总结 |
AI办公类产品 | WPS AI 2.0 | 2024年7月5日 | 新增AI写作、AI阅读、AI数据、AI设计办公助手 |
百度文库 | 2024年5月30日 | 包括自由画布、智能PPT、AI搜索(呈现速览、图表、可信度评估)等功能 | |
腾讯元宝 | 2024年5月30日 | 支持语言文字搜索,涵盖微信公众号视频号等资源 |
三、 AI视频类产品
类型 | AI产品 | 发布时间 | 亮点总结 |
AI视频类产品 | 海螺AI Hailuo I2V-01-Director | 2025年2月24日 | 全新的导演剪辑模式,可通过精确的摄像机控制来体验电影般的叙事方式。海螺AI还能够克隆声音,情绪张力表现优秀 |
英伟达 Cosmos | 2025年1月7日 | 生成式世界基础模型,推动开发自动驾驶汽车和机器人等物理AI系统 | |
生数科技 Vidu 2.0 | 2025年1月15日 | 价格更低、速度更快(秒级生成) | |
潞晨 Video Ocean V2.0 | 2025年1月13日 | 亮点是免费使用 | |
可灵1.6模型 | 2024年12月19日 | 主要提升文本响应度、运动合理性及画面美感,同时支持标准和高品质模式 | |
Adobe TransPixar | 2025年1月9日 | 开源,可生成透明背景视频,无需额外抠图 | |
Hailuo AI | 2024年12月3日 | 宣布了创新功能,将静态图像转为动态效果 |
四、 AI绘图类产品
类型 | AI产品 | 发布时间 | 亮点总结 |
AI绘图类产品 | 即梦AI | 2024年5月9日 | AI作图和AI视频生成功能全量上线,优化了中国元素、写实场景和摄影方向 |
Stable Diffusion 3 | 2024年6月12日 | 开源权重,20亿参数,在照片真实感、样式、图片质量、算力资源消耗等方面大幅度优化 | |
可图1.5 | 2024年12月27日 | 图像质量美感显著提升,推出AI模特功能 |
五、 AI编程类产品
类型 | AI产品 | 发布时间 | 亮点总结 |
AI编程类产品 | Trae | 2025年1月19日 | 字节出品的AI编程产品,全中文界面,适合小白,限时免费,目前仅支持mac系统 |
Claude Code | 2025年2月25日 | 支持搜索、编辑代码、运行测试、提交代码到GitHub等操作 |
六、其他
类型 | AI产品 | 发布时间 | 亮点总结 |
其他 | 腾讯混元3D生成大模型2.0 | 2025年1月21日 | 用于3D建模、编辑及驱动,2.0在几何结构上更精细,纹理色彩更丰富 |
小米 AI智能眼镜 | 2025年(尚未发布) | 更加轻便的外观,支持语音、手势或眼动控制,可实现实时翻译、导航 | |
Rokid Glasses | 2024年11月18日 | 智能眼镜,支持物体识别、文字翻译、数学题解答 | |
海绵音乐 | 2024年8月6日 | 字节出品,提供灵感创作和自定义创作两种模式,能生成1分钟左右的音乐,曲风符合国人喜好,门槛低,对中文支持良好 |
七、总结和感想
当前AI产品高速发展不断进化,主要趋势朝着更强大的推理理解能力、更快速的响应、更低的价格上发展,并在多领域上结合,诞生出各式各样的产品,而在AI大模型的架构创新方面,长上下文优化和多模态统一架构成为了重要的发展方向。