
大模型
文章平均质量分 70
CSDN资讯
专业的中文 IT 技术社区,与千万技术人共成长。
展开
-
DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
大模型的竞争已经进入白热化阶段原创 2025-02-28 19:02:16 · 5324 阅读 · 1 评论 -
文心智能体平台全量上线DeepSeek满血版
2月21日,文心智能体平台已全量上线DeepSeek的四款模型。原创 2025-02-21 17:41:38 · 617 阅读 · 0 评论 -
Gartner:DeepSeek持续爆火,引发大模型低价、开源、工程化竞争
DeepSeek 推出的 R1 模型热度持续高企,在春节第一波引发股市震荡、登顶全球 App Store 免费下载榜之后,DeepSeek 在继续引发连锁反应:美国 AI 搜索公司 Perplexity 宣布支持 R1 模型,亚马逊、微软、谷歌等科技巨头亦将其纳入云平台。热潮从中国蔓延至美国,再反向影响国内市场。现在,全民都在关注并尝试使用,字节和阿里云大模型大幅降价,百度两款主力大模型宣布免费,各家大厂纷纷接入 DeepSeek 服务。原创 2025-02-18 20:52:55 · 868 阅读 · 0 评论 -
60秒内即可生成5秒AI视频,豆包视频生成模型Seaweed上线即梦AI
Pro版模型能实现自然连贯的多拍动作与多主体复杂交互,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,适配电影、电视、电脑、手机等各种设备的比例,可以更好地服务于专业创作者和艺术家们,应用于设计、影视、动画等内容场景,助力想象力的实现和故事创作。平台相关负责人表示,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,通过开放豆包视频生成模型的使用和持续升级平台各项AI能力,即梦AI希望成为用户最亲密和有智慧的创作伙伴。即梦AI App端模型使用入口。原创 2024-11-08 18:00:41 · 729 阅读 · 0 评论 -
类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!
近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。原创 2024-11-08 17:57:54 · 1168 阅读 · 0 评论 -
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
据豆包大模型团队介绍,HybridFlow 采用混合编程模型,将单控制器的灵活性与多控制器的高效性相结合,解耦了控制流和计算流。基于 Ray 的分布式编程、动态计算图、异构调度能力,通过封装单模型的分布式计算、统一模型间的数据切分,以及支持异步 RL 控制流,HybridFlow 能够高效地实现和执行各种 RL 算法,复用计算模块和支持不同的模型部署方式,大大提升了系统的灵活性和开发效率。然而,随着模型规模的不断扩大,RL 算法在大模型训练中面临着灵活性和性能的双重挑战。原创 2024-11-01 14:32:28 · 4584 阅读 · 0 评论 -
浩鲸科技发布“鲸智大模型”技术体系,做场景落地践行者
精准对接政企行业需求,为行业企业提供量身定制的一站式大模型产品及服务,助力企业加速智能化转型步伐。原创 2024-09-21 17:03:48 · 3783 阅读 · 0 评论 -
腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件
自混元DiT模型开源以来,得到了众多开发者的支持和反馈,腾讯混元团队也一直在持续完善和优化基于混元DiT的开源组件,与行业共建下一代视觉生成开源生态。同时模型易用性大幅提升,用户可以基于ComfyUI的图形化界面,使用混元DiT,或者通过Hugging Face Diffusers通用模型库,仅用三行代码即可调用混元DiT模型,无需下载原始代码库。这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化的专属模型,进行更大自由度的创作;或创造出盲盒、黏土等风格模型。原创 2024-06-21 11:02:10 · 3936 阅读 · 4 评论 -
降价97%!通义千问GPT-4级主力模型Qwen-Long 降至0.0005元/千tokens
降价后约为GPT-4价格的1/400,击穿全球底价。原创 2024-05-21 12:36:51 · 830 阅读 · 0 评论 -
MediaTek 携手生态伙伴联合发布《生成式 AI 手机产业白皮书》,共同定义生成式 AI 手机
《生成式 AI 手机产业白皮书》详细地阐述了生成式 AI 与智能手机深度融合的趋势,深入探讨了生成式 AI 手机生态中芯片厂商、手机厂商、大模型厂商、开发者的 AI 战略,以及生成式 AI 手机的软硬件科技全景,并给出了 Counterpoint 对生成式 AI 手机发展的预测。原创 2024-05-08 18:10:06 · 744 阅读 · 0 评论 -
元象首个多模态大模型开源,刷新权威大模型榜单,支持任意宽高比输入
XVERSE-V 性能优异,在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。兼顾全局的概览信息和局部的细节信息,能够识别和分析图像中的细微特征,看的更清楚,理解的更准确。具备不同场景下的理解能力,能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。原创 2024-04-28 12:40:35 · 1467 阅读 · 0 评论