
AI
文章平均质量分 80
CSDN资讯
专业的中文 IT 技术社区,与千万技术人共成长。
展开
-
AI座舱或是下一个开发热点,中国电动汽车百人会论坛(2025)观察
中国电动汽车正在崛起。由国家新能源汽车第三方智库——中国电动汽车百人会主办是中国电动汽车百人会论坛(2025),于2025年3月28日—30日在北京召开,今年以“夯实电动化 推进智能化 实现高质量发展”为主题,举办高层论坛、国际论坛、理事研讨会、全球政策圆桌会、12场主题论坛。论坛汇集了国内外几乎所有主流电动汽车车厂,以及电池、芯片、供应链、AI大模型等等主流厂商、机构,讨论话题涉及了产业发展、智能与AI、电池创新、设计等等方面。原创 2025-04-02 21:21:39 · 620 阅读 · 0 评论 -
信任、可选择、一致性的企业 AI,红帽端出整套 AI 产品组合
企业落地 AI 的挑战也显而易见,首先训练和运行大型模型需要大量的昂贵计算资源,企业则更侧重于模型的推理,规模化应用仍需要占用较多资源成本。和 RAG 不同,InstructLab利用分类法引导的合成数据生成过程和多阶段调优框架来提升模型性能,以及更易于微调的访问,可以简化企业私有数据定制模型的过程,降低企业 AI 的成本与复杂度。针对这些挑战,在企业 AI 的算力、模型、数据、AI 应用开发各层,红帽通过混合云架构,提供灵活的 AI 部署和运维、开发的支持。模型、增强大语言模型的工具。原创 2025-03-31 10:37:35 · 1011 阅读 · 0 评论 -
多端一致的边缘 AI 来了,英特尔推出全新 AI 边缘系统、套件与开放平台
具体到边缘侧,开放生态系统如何为边缘 AI 加速:在许多边缘部署都采用传统的机器学习和计算机视觉来集成 AI 的背景下,英特尔 AI 边缘系统、边缘 AI 套件和开放边缘平台软件将赋能先进 AI 应用部署的加速。),其中提到AI 是复杂多层的系统,从客户端到边缘,再到数据中心和云,企业级 AI 方案需要不同的软件模块灵活部署与运行,加速 AI 从概念到实际投产的进程。通过简化与现有基础设施的集成,这些解决方案精简并加速了 AI 在边缘的应用,包括在零售、制造、智慧城市、媒体和娱乐等行业的部署。原创 2025-03-25 12:52:24 · 788 阅读 · 1 评论 -
DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
大模型的竞争已经进入白热化阶段原创 2025-02-28 19:02:16 · 5773 阅读 · 1 评论 -
硬件再次成为主角,AI 将颠覆核心系统,德勤发布技术趋势 2025
小模型的另一个优势是可以在设备端运行,并且企业能够用较小规模、经过精心整理的数据集对其进行训练,来解决更为具体的问题,而不仅限于泛泛的查询。这已经是德勤第 16 年在全球发布对未来技术走向的专业预测,将未来 18 至 24 个月内对企业数字化转型至关重要的技术趋势,通过德勤跨行业的深厚经验总结叠加真实案例分析的表现方式,沿袭“交互、信息、计算、技术业务、网络与信任、核心现代化”六大方向,为企业推动创新发展提供跨界探索的指引和引领实践的洞察。随着个性化需求的增长,越来越多的企业开始转向量身定制的小模型。原创 2025-02-27 10:57:58 · 1109 阅读 · 0 评论 -
文心智能体平台全量上线DeepSeek满血版
2月21日,文心智能体平台已全量上线DeepSeek的四款模型。原创 2025-02-21 17:41:38 · 668 阅读 · 0 评论 -
纪念斯隆-凯特琳癌症中心与亚马逊云科技携手,加速人工智能驱动的癌症创新
此次合作将深度融合人工智能技术,推动转化研究领域的创新突破,旨在显著提升患者护理水平与治疗效果原创 2025-02-21 14:43:07 · 768 阅读 · 0 评论 -
Gartner:DeepSeek持续爆火,引发大模型低价、开源、工程化竞争
DeepSeek 推出的 R1 模型热度持续高企,在春节第一波引发股市震荡、登顶全球 App Store 免费下载榜之后,DeepSeek 在继续引发连锁反应:美国 AI 搜索公司 Perplexity 宣布支持 R1 模型,亚马逊、微软、谷歌等科技巨头亦将其纳入云平台。热潮从中国蔓延至美国,再反向影响国内市场。现在,全民都在关注并尝试使用,字节和阿里云大模型大幅降价,百度两款主力大模型宣布免费,各家大厂纷纷接入 DeepSeek 服务。原创 2025-02-18 20:52:55 · 914 阅读 · 0 评论 -
任何地方防护、交付并优化任何应用及 API,F5 中国全新发布三大策略
2025开年伊始,老牌的多云应用安全和应用交付网络厂商 F5 以全新的战略视角,举办“AI for ADC,ADC for AI”为主题的 2025 年新春媒体见面会,深入解读分享生成式人工智能(AI)的前沿趋势,并宣布将在中国市场通过三大策略全面推动 AI 应用,包括携手伙伴打造全面的 AI 产品组合、积极推动汽车、生物制药、高端制造等行业方案应用和创新实践,以及共创渠道伙伴生态,不仅充分彰显 F5“打造更好的数字世界”的企业愿景,也将更好地帮助中国企业用户加速数字化转型,打造新质生产力。原创 2025-02-14 16:07:51 · 733 阅读 · 0 评论 -
以创新测评赋能未来:CSDN开源与智能技术创新研究院发布大模型综合榜单
本次测评基于“在中小企业或者个人用户可轻松获取与使用”的原则,从本地部署能力与API可用性两大基础指标出发,结合多维度场景化测评方法,全面呈现各大模型在数学推理、知识问答、指令生成、内容创作、安全对齐、小样本学习等方面的真实表现。更重要的是,本次测评不仅仅是给出一个静态的排行,而是通过场景投票和专业评审,形成了贯穿多个行业场景的实践经验与技术洞见。随着后续慢推理模式、deepseek等新模型的引入,以及对多模态、跨领域能力的进一步挖掘,相信在下一阶段的大模型测评榜单上,我们将看到更多惊喜与革新。原创 2025-02-11 14:43:14 · 2032 阅读 · 2 评论 -
开发者怎么使用DeepSeek?听听CSDN博主们怎么说
蛇年开年的第一个热搜,非DeepSeek莫属。杭州深度求索公司临近除夕发布的开源模型DeepSeek-R1引发了全球关注。实现性能对标 OpenAI-o1 正式版,经受住各方评测的DeepSeek,从深度求索发布论文可以清晰了解它的设计思路和优势。目前DeepSeek访问量暴增,网页版已间歇性“躺平”。可以看出,DeepSeek的爆火也印证了中国技术界一直在讨论和探索的话题,例如,在AI算力堆资源搞“装备竞赛”的传统路径之外,DeepSeek蹚出了一条算法创新的新路。原创 2025-02-08 11:59:18 · 12053 阅读 · 0 评论 -
启明星辰全面对接DeepSeek大模型,全场景智能化安全再升级
近日,人工智能应用DeepSeek横空出世,引发全球科技圈高度关注。本次发布的安星智能体“DeepSeek版”将Deepseek的MOE模型结构与启明星辰的多专家模型动态加载专利技术相结合,不仅提高了推理速度,还有效降低了对智算硬件的算力要求,进一步完善了基础模型、安全应用、底层硬件全面自主可控的安全运营体系。未来,随着基础大模型能力的不断提升,启明星辰将持续升级安星智能体应用能力,扩展AI+安全应用场景,为广大用户提供更加智能、便捷、高效的安全产品和服务,为打造清朗的网络空间贡献力量。原创 2025-02-07 16:05:11 · 5649 阅读 · 0 评论 -
DeepSeek爆火引仿冒潮!奇安信预警:已发现2650个钓鱼陷阱!
此外,骗子紧跟技术潮流,利用市场的兴奋情绪,还推出了所谓“DeepSeek 加持”的各种高大上功能的空气币(无实质价值的虚拟货币),甚至出现宣称可以购买DeepSeek内部原始股的网站。此外,这些仿冒DeepSeek的域名中有60%解析IP位于美国,其余主要分布在新加坡、德国、立陶宛、俄罗斯和中国,仿冒域名所呈现出的全球化特点,意味着用户可能面临来自世界各地不同类型的网络攻击,潜在安全威胁更加复杂多样。这类模仿现象,有的可能只是出于商业目的,想借助 DeepSeek 的热度售卖有前途的域名或者吸引用户;原创 2025-02-07 10:42:17 · 630 阅读 · 0 评论 -
GitCode 重磅上线 DeepSeek 全家桶!领航国产大模型新征程
这个春节,AI 领域热闹非凡,DeepSeek 一路 “狂飙”,,1 月 27 日,美国三大股指开盘即暴跌,英伟达、微软、谷歌母公司 Alphabet、Meta 等美国主要科技股均遭遇股市地震,其中英伟达跌近 17%,单日市值蒸发约 6000 亿美元,创美股最高纪录。DeepSeek 以开源的特性和极低的成本,在数学、编程、自然语言推理等任务上表现出色,性能不亚于美国顶级 AI 模型。特别是 DeepSeek-R1,通过创新性运用强化学习技术,以极少量标注数据实现了推理能力的跨越式提升。。原创 2025-02-06 20:32:08 · 8698 阅读 · 3 评论 -
腾讯混元3D生成能力全面升级!开源2.0版本并上线业界首个3D AI创作引擎
据了解,3D AIGC技术快速迭代,3D技术应用落地进程也在不断加快,游戏制作、社交、电商广告、工业制造、具身智能、自动驾驶、AR/VR、三维打印等多个领域都积极应用AI能力辅助3D内容生产,如在游戏制作环节,快速生成高质量的游戏角色、道具、建筑等3D资产,提升游戏开发效率。值得一提的是, 混元3D AI创作引擎还支持设计3D生成工作流,呈现3D创作管线核心流程。在3D功能矩阵方面,创作引擎涵盖了丰富的3D建模、编辑及驱动等能力,包括3D动画生成、3D纹理生成、草图生3D、3D人物生成、3D小游戏创作等。原创 2025-01-21 18:22:24 · 1230 阅读 · 0 评论 -
对标Cursor,字节跳动发布面向海外的中文AI IDE 工具 Trae
官方表示,Trae主要针对希望提高编程效率、减少重复性工作的开发者设计,无论是初学者还是资深开发人员都能从中受益。该工具特别适用于需要快速构建项目的团队,其聊天构建模式能显著提升编码速度和质量。字节跳动于1月19日推出了一款全新的AI编程产品——Trae,旨在为专业开发者提供高效的服务。这款工具由字节跳动旗下新加坡公司SPRING PTE.LTD提供支持,具备AI问答、代码自动补全及基于Agent的AI编程等功能。Trae能够帮助程序员自动化完成开发任务,在某些项目中甚至可以实现端到端的开发流程。原创 2025-01-21 17:34:59 · 1547 阅读 · 0 评论 -
一个普通程序员对 AI 十倍工程师的困惑
AI 拉平了普通开发者之间的差距,每一个开发者都不再是独立的个体,都将拥有一个 AI 搭子。开发范式的变迁,我们要如何更好地使用 AI 帮助日常的开发工作?如何解决开发者与 AI 的融合难题?原创 2025-01-11 19:00:15 · 4853 阅读 · 0 评论 -
可信数据、事件驱动 AI 智能体、多云、私有模型……Cloudera发布2025年科技趋势预测
例如,金融服务机构作为生成式 AI 的早期用户,正逐步从基于规则的欺诈检测系统向基于模型的系统转型,推动行业迈向新的发展阶段。随着混合环境的逐步扩展,企业的数据分布于本地、大型机、公有云和边缘等多种平台,生成式 AI 模型需要灵活部署到数据所在之处,确保数据和工作负载在业务内的无缝迁移,以产生高效洞察并满足企业需求。随着混合环境的逐步扩展,企业的数据分布于本地、大型机、公有云和边缘等多种平台,生成式 AI 模型需要灵活部署到数据所在之处,确保数据和工作负载在业务内的无缝迁移,以产生高效洞察并满足企业需求。原创 2024-12-31 09:23:59 · 756 阅读 · 0 评论 -
蚂蚁旗下数字蚂力推出AI就业平台:为个人和企业提供个性化岗位匹配
对就业者来说,该平台在客服岗位基础上,增加了标注、主播、审核、云值守岗位,UI设计师、品牌视觉设计师、营销视觉设计师、插画设计师、动画设计师等设计类岗位,以及Java研发、质量测试、前端研发等开发类岗位,岗位数量超万余。通过AI技术的辅助,数字蚂力构建了一个可以实现人才自动匹配的分布式招聘资源网络,旨在为就业者提供机会,也为有数智化转型需求的企业提供更精准、高效的服务。,包括云客服能力,开放出来,提供“人机融合”的解决方案,帮助企业更便捷地。我们坚信,通过AI技术的应用和升级,可以进一步。原创 2024-12-27 16:01:20 · 593 阅读 · 0 评论 -
联想与火山引擎官宣合作,为AI桌面助手接入豆包大模型
在智源研究院最新发布的全球大模型评测榜单中,豆包通用模型pro在重点考察中文能力的主观评测中排名第一,知识运用和推理能力均获得最高分,简单理解、数学能力、安全等项目也排名前三。12月26日,在2024联想天禧生态伙伴大会上,联想正式宣布与火山引擎牵手合作,为其 AI 桌面助手如意(AI Stick),植入豆包大模型“超强大脑”,全方位提升用户体验。AI写作为用户提供辅助创作能力。全新升级后的如意,推出了 AI 搜索、AI 写作、AI 聊天三大 AI 新功能,可以让用户按需打造专属个性化 AI 空间。原创 2024-12-27 12:34:56 · 457 阅读 · 0 评论 -
Tele-FLM-1T与星辰语义大模型重磅发布,TeleAI:完成全国产化万卡万参大模型训练!
基于此,智源研究院研发了 MSG 模型生长技术(Masked Structural Growth),该技术支持横向、纵向共计四种灵活的生长方式,在 Bert-large 级别的模型上,在下游任务性能不下降的前提下成功实现了 120% 的提速。科技创新,永不止步。宋双永在会上坦言,未来,中国电信人工智能研究院将与生态伙伴、客户、开发者共同探索更多大模型与行业结合的创新路径,为千行百业的持续增长注入强劲、安全、可靠的新动力,加速数字经济高质量发展,共同携手创造更好的、美好的人工智能的生态。原创 2024-12-27 11:29:26 · 1309 阅读 · 0 评论 -
高文院士推介,中国算力网(C²Net)开源开放试验场科技成就重磅发布
当前,算力已逐渐成为新质生产力的代表,可以说“算力即国力”、“算力即生产力”,在高端算力、中端算力和个人普惠级的算力层次,国际前沿的技术竞争相当激烈。鹏城实验室高效能云计算所所长余跃指出,为建设开源创新体系,在中国算力网建设初期,鹏城实验室就把开源开放定位在战略高度,实验室牵头建设的E级智能算力大科学装置鹏城云脑构建了一站式开源平台,通过算力网以云际互联的方式接入 30 多个分布在全国的公共算力集群,兼容了 12 种异构算力芯片,搭建了面向人工智能协同开发的软件工具链,服务开源社区各种差异化需求。原创 2024-12-27 11:26:40 · 1925 阅读 · 0 评论 -
书生大模型科技成就重磅发布!上海人工智能实验室:迈向通用人工智能
其一,基于通、专模型协作合成高密度数据。陈恺提到,实验室研发团队设计了一系列“元动作”来引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等,使得 InternThinker 能够以更加接近人类学习的方式高效提升能力,在面对复杂任务时,会动态地选择“元动作”,再进一步展开相关动作的具体思维过程。作为一个对标 GPT 系列的大语言模型,书生·浦语 2.5 谱系覆盖了从 1.8B、7B、20B 到 102B 的跨量级模型尺寸,可满足不同的应用需求,其中 1.8B 到 20B 都是开源的。原创 2024-12-27 11:21:45 · 3146 阅读 · 0 评论 -
AI新周期“一体多端”战略再升级,新一代智能体系统天禧AS全揭秘
AI智能体时代初现端倪,联想凭借深厚的技术底蕴与敏锐的市场洞察力,在此次大会上宣布联想天禧生态“一体多端”战略中的“一体”,正式升级为天禧个人智能体系统即“天禧AS”。他表示,智能体是当下AI时代备受瞩目的概念,尤其在众多应用场景上,智能体展现着巨大的潜力。本次大会还将“水”的哲学意向融入了天禧AS的整体设计之中——正如水能滋养万物、适应各种环境,天禧AS也在灵活地适应用户需求,提供个性化服务,同时在多智能体的协作中,展现出如水般汇聚成海的强大力量,共同解决复杂问题,提升运行的整体效率。原创 2024-12-26 20:58:57 · 1017 阅读 · 0 评论 -
Amazon EKS 最新创新,能否让 Kubernetes 更加亮眼?
EKS Auto Mode 登场,Kubernetes 未来将无处不在!原创 2024-12-24 09:38:38 · 21666 阅读 · 0 评论 -
腾讯云发布数据智能平台TCHouse-X,面向大模型等应用提供一站式数据处理能力
在架构设计层面,TCHouse-X通过一体化的架构设计,通过云原生多集群共享数据及元数据管理,打破了传统数据平台在离线计算、在线计算和AI开发之间的壁垒,用户可以基于同一份数据运行在线分析、离线处理、数据湖探索和机器学习等多种业务负载,无需在不同的系统间切换和数据的拷贝搬迁,实现AI、BI和Data在一个平台上开发和共建。目前,TCHouse-X已在大模型AIGC应用、车联网数据平台等业务的在线分析、离线数据处理、日志分析、数据科学与机器学习等场景提供了高效、稳定的数据分析支持。”腾讯云副总裁黄世飞表示。原创 2024-12-19 19:43:14 · 574 阅读 · 0 评论 -
聚力创新人才早期培育,第八届“智慧杯”总结会顺利举行
北京市教育委员会信息化处处长吴雅星,北京市数字教育中心主任田鹏,北京市数字教育中心副主任史陈新,海淀区教育委员会副主任徐丹,海淀区教育科学研究院书记、院长吴颖惠,北京师范大学教育学部教授李玉顺,海淀区教委智慧办主任刘伟,北京市数字教育中心数字教育研究推广部主任季茂生,北京市数字教育中心数字教育研究推广部副主任赵筱妹,网易有道高级副总裁罗媛,网易有道编程项目总监张鹏,网易有道技术总监黄瑾,网易有道编程教研负责人顾静,以及大赛专家组的教练代表和获奖学生代表、优秀教师代表参会。原创 2024-12-18 15:23:12 · 651 阅读 · 0 评论 -
全球AI顶会 NeurIPS 2024温哥华开幕,中国校企百余篇论文被收录
比如论文《重新审视显存和通信成本对大语言模型高效数据并行训练的影响》针对大语言模型(LLM)分布式训练的速度与效率问题,提出了一组新的基础策略,一个名为 PaRO 的部分冗余优化器,通过更精细的分片策略以适配不同的训练场景,加速 LLM 的训练。据了解,加速 AI 在行业垂直领域的落地应用,亦是蚂蚁集团重投 AI 的重点攻坚方向,或者说,聚焦提升AI的经济性、可信性和效率,就是为了加速AI在行业垂直领域,尤其在金融、医疗、遥感等严谨产业中的落地应用。原创 2024-12-11 14:25:31 · 4615 阅读 · 0 评论 -
大地保险完成首个AI中台建设,蚂蚁数科提供技术支持
近日,中国信息通信研究院AI云典型案例评选正式揭晓结果,中国大地保险与蚂蚁数科共建AI中台大模型项目获选,成为“AI Cloud助力大模型场景化和工程化落地”优秀案例,同批入选包括阿里云、腾讯云、华为、中国移动等。记者了解到,这是保险业内首次将大模型、数据、算力和框架结合,打造资源可共享、模型可复用、服务可编排、应用更灵活的AI中台,集成经过规模化验证的专业大模型应用矩阵,让大模型的技术栈与行业特定垂直场景紧密结合。“中国大地保险积极关注数字化转型带来的机遇与挑战。”中国大地保险科技中心总经理詹强表示。原创 2024-12-10 14:34:48 · 5708 阅读 · 0 评论 -
凭借昇腾澎湃算力,Open-Sora Plan实现电影级视频生成
随着科技新浪潮的加速翻涌,Open-Sora Plan 和昇腾两者究竟是如何双向奔赴,跑出创新加速度?原创 2024-11-27 11:44:19 · 6832 阅读 · 0 评论 -
NeurIPS 2024大模型隐私挑战赛落幕,中国团队夺得赛道冠军
在防御赛道中,我们利用数据脱敏与合成技术,对包含PII的语料进行随机替换,之后以自回归的方式微调目标模型,可以扰乱大模型对PII信息的记忆,降低其输出正确PII的可能,防止隐私数据泄漏。蚂蚁数科摩斯结合比赛同款方案,研发了大模型隐私保护产品,该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线,实现大模型应用中模型微调、推理全链路的数据和模型隐私保护。蚂蚁数科摩斯技术负责人殷山表示,“摩斯将在大模型隐私保护方向,持续进行技术投入和落地探索,推进大模型在产业界发展。原创 2024-11-25 15:16:53 · 5813 阅读 · 0 评论 -
Gartner:AI 治理将与安全同等重要,成企业“标配”
其中混合计算提到,未来不仅有量子计算,甚至可以结合神经形态、量子计算、光计算,以及生物和碳计算的技术,将这些新的计算范式编排,利用其各自的优势和各自的能力去解决不同的问题。当然,现阶段的混合计算还是局限在比较小规模的异构计算资源(如 CPU 和 GPU 的整合),混合计算的成熟至少需要 3-10 年的时间。虚假信息安全是一个新兴技术类别。Gartner 预测,到 2030 年,30%的知识工作者将通过 BBMI 等技术(资金来源包括雇主和个人)提升自己的能力,并凭借这些技术来适应工作场所中 AI 的崛起。原创 2024-11-14 12:28:58 · 3776 阅读 · 0 评论 -
60秒内即可生成5秒AI视频,豆包视频生成模型Seaweed上线即梦AI
Pro版模型能实现自然连贯的多拍动作与多主体复杂交互,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,适配电影、电视、电脑、手机等各种设备的比例,可以更好地服务于专业创作者和艺术家们,应用于设计、影视、动画等内容场景,助力想象力的实现和故事创作。平台相关负责人表示,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,通过开放豆包视频生成模型的使用和持续升级平台各项AI能力,即梦AI希望成为用户最亲密和有智慧的创作伙伴。即梦AI App端模型使用入口。原创 2024-11-08 18:00:41 · 811 阅读 · 0 评论 -
类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!
近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。原创 2024-11-08 17:57:54 · 1193 阅读 · 0 评论 -
1024 程序员节智能应用论坛回顾:共筑智能应用新生态!
智能应用作为新时代科技创新的重要力量,正在深刻地改变我们的生活;程序员作为智能应用的开发者和推动者,肩负着时代的重任。随着第五届“长沙·中国 1024 程序员节”智能应用论坛圆满落幕,希望开发者以匠心精神打造更多智能应用为目标,一起为行业进展做出更多努力与贡献!原创 2024-11-08 12:54:00 · 6036 阅读 · 0 评论 -
英特尔发布至强6性能核处理器,携手生态加速数据中心算力升级
在推动基础设施创新的同时,英特尔亦持续从打造解决方案到构建行业统一标准等多维度,助力高能效数据中心发展。),最高配备128个内核,支持高达每秒6400MT的DDR5内存、每秒8800MT的MRDIMM内存、6条UPI 2.0链路(速率高达每秒24 GT),96条PCIe 5.0或64条CXL 2.0通道、504MB的L3缓存,支持FP16数据格式的英特尔® 高级矩阵扩展(英特尔® AMX),可为AI和科学计算等内存带宽敏感型工作负载提供MRDIMM选择,且新增对CXL 2.0的支持。原创 2024-09-26 18:42:18 · 1045 阅读 · 0 评论 -
浩鲸科技发布“鲸智大模型”技术体系,做场景落地践行者
精准对接政企行业需求,为行业企业提供量身定制的一站式大模型产品及服务,助力企业加速智能化转型步伐。原创 2024-09-21 17:03:48 · 3793 阅读 · 0 评论 -
通义灵码AI编程能力再进化,几句话实现多种开发任务
通义灵码还可以脱离专业IDE软件,在web端直接执行缺陷修改、需求分析、代码实现、问题排查等任务工作流,兼具架构师、开发工程师、测试工程师等多种岗位技能,大幅缩短了应用的开发周期。9月 19 日,在2024杭州云栖大会上,随着通义大模型能力的全面提升,阿里云通义灵码迎来重磅升级,从一年前只能完成基础的辅助编程任务,进化到几句话就能完成需求理解、任务拆解、代码编写、修改BUG、测试等开发任务,最快几分钟可从0到1完成应用开发,提升数十倍开发效率。现在,人类只需要输入需求,通义灵码5分钟就能完成整个过程。原创 2024-09-19 19:27:17 · 549 阅读 · 0 评论 -
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。相比上一代模型,Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了700%以上。Qwen-Max表现接近GPT-4o,数学能力、代码能力。数学和代码所代表的推理能力是大模型智能水平。原创 2024-09-19 19:24:40 · 609 阅读 · 0 评论 -
通义千问重磅开源Qwen2.5,性能超越Llama
Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等权威测评中表现出色,在多个核心任务上,以不到1/5的参数超越了拥有4050亿巨量参数的Llama3.1-405B,继续稳居“全球最强开源大模型”的位置。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。原创 2024-09-19 19:21:03 · 4202 阅读 · 6 评论