- 博客(6894)
- 资源 (2)
- 收藏
- 关注
转载 李建忠:大模型技术创新驱动的 AI 生态和应用演进
简单的概括,预训练是所谓的“讲知识”,后训练是所谓的“讲文明”,跟人类的价值观对齐。当模型使用不同语言在思考“苹果”时,都会首先使用这个“苹果的抽象概念”,然后在最后输出时再将其映射为具体的语言。而经验数据时代,将带来强化学习基于环境反馈的经验数据,它是更长周期的积累,尤其加了长期记忆能力之后,它将是一个未知的探索,它有可能突破人类现有知识的边界,引领人类对未知领域进行创新探索。年前,人类发明文字,我们中国的仰韶文化、龙山文化等,被认为是汉字的起源,人类智能开始腾飞,人类文明开启。协作是人类更高阶的智慧。
2025-04-24 11:40:11
1028
1
转载 靠开发AI作弊神器成名,21岁小伙遭学校开除不足一月后,转身拿下530万美元融资!
据官方介绍,这款工具能够规避 Zoom、Google Meet 等平台的屏幕监控功能,还加入了多种反偷拍、反追踪的设计,力求“隐形、无感、安全”。尽管他坚称这款工具不针对学术考试,哥伦比亚大学仍认定 Interview Coder 有潜在的“学术不端用途”,并裁定他存在“协助作弊”的行为,最终。殊不知,这段视频也成为他命运的转折点。Cluely 的成立,有人称赞这类 AI 产品“话题十足,吸睛有术”、称他们是“这一代最有野心的创业者”,也有人毫不留情地批评其宣传片:“这简直像一部活生生的《黑镜》宣传片。
2025-04-23 17:01:46
216
转载 直播|Tuya AI硬件开发平台开源啦!搭载超强AI能力,助力个人开发者打破技术壁垒
学生与高校:通过 TuyaOpen 提供的教学资料,学生可快速上手学习编程,并用于设计毕业作品、电子竞赛套件等,轻松实现智能小车、环境监测等创新项目;同时,也可帮助高校快速开设智能化与 AI 融合的教学课程;开发者可以无缝调用国内合规的大模型(如 DeepSeek、通义千问、豆包等),或灵活对接海外顶尖的 AI 大模型服务(如 ChatGPT、Claude、Gemini 等);协议栈与示例:提供 Wi-Fi、蓝牙、Zigbee 等不同协议的设备配网、连接、控制全流程代码,覆盖智能家居、工业物联网等场景;
2025-04-23 17:01:46
177
原创 我悟了如何与AI说话!谷歌 69 页官方提示词秘籍全解析,中文版免费下载
这就像投票,大多数“路径”都指向的答案,往往就是最靠谱的那个,虽然计算成本高了点(要跑 N 次),但在追求极致准确率的场景下,效果拔群。白皮书甚至提供了一个记录模板。Google 这份白皮书,不是某个博主的心得体会,不是零散的技巧合集,而是 Google 官方基于对大语言模型(LLM)的深刻理解,系统性梳理出来的方法论、技巧库和最佳实践。即使是 OpenAI o1、DeepSeek R1 这些主打推理能力的新时代模型出来了,大家以为可以“傻瓜式”对话了,结果该懵圈的时候还是懵圈,该跑偏的时候照样跑偏——。
2025-04-22 18:27:18
7056
转载 机器人跑马拉松,到底在比什么?
N2 机器人身高 1.2 米,体重约 30 公斤,拥有 18 个自由度(单腿 5 个、单臂 4 个),关节扭矩达 150N·m 以上的优势很可能在于其扎实的动态运动控制技术、精巧的平衡控制系统、和仿生关节与自由度设计所构建的坚实底座。深圳市人工智能与机器人研究院副研究员夏轩指出,“真实数据的采集只能线性增长,而模型训练的性能提升则遵循指数规律,数据的增长无法跟上项目性能的增长。4月19日,全球首个的“人机共跑”半程马拉松在北京亦庄开跑,以其前所未有的形式和硬核的技术含量,瞬间引爆了科技圈和大众视野。
2025-04-21 18:25:34
6142
1
转载 Agent、DeepSeek、多模态热点炸场!60+重磅嘉宾共探AI未来,2025全球机器学习技术大会完美收官!
在这一背景下,本次大会以全球视角聚焦 AI 最前沿的发展趋势,围绕大语言模型技术演进、AI Agent 实践、具身智能、多模态生成、DeepSeek 技术解析等 12 大专题展开深入探讨,与海内外一线科技公司与高校机构的专家学者,共同勾勒出大模型技术的创新脉络与落地全景。此次大会汇聚了来自微软、百度、阿里巴巴、腾讯、字节跳动、蚂蚁集团、智源研究院、小红书、网易、商汤科技、小米、360、AMD数十家领军企业和组织的技术专家,他们从科研创新、工程落地到产业趋势,带来了兼具深度与前瞻的思考。
2025-04-21 18:25:34
359
转载 AI 教父最新警告:AI 导致人类灭绝风险高达 20%,留给人类的时间不多了!
然而,轻松的谈笑之后,是他对未来的深沉忧虑:“我认为人类面临的 AI 风险,远比我们想象中要严重得多。想象一下你拥有一个 AI“家庭医生”,它看过上亿病人的病例,了解并记得你和你家人做过的每一次检查,能给出更准确的诊断。对于婴儿来说,控制母亲是非常重要的。我们知道,有私人家教的孩子,学习效率可以提升一倍,因为家教可以及时发现孩子没理解的地方。此外,他还罕见地公开批评了科技巨头埃隆·马斯克,认为其行为正在损害美国的科学根基,这场“教父”与首富的隔空交锋,也折射出 AI 发展道路上复杂的科技、伦理与政治博弈。
2025-04-18 13:55:49
311
转载 中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
正因为如此,这次发布的榜单正是以“模型、数据、系统、评测平台”为骨架,设置了共 53 项核心评估指标,包括模型使用量、模型模态覆盖度、模型适配的芯片数量、贡献者活跃度、数据集的覆盖情况、数据处理工具、开源 AI 编译器、通信库、评测工具等,力求全面、客观地呈现出各大机构在大模型开源生态中的综合技术实力。仅统计公开可查的模型,为数据集发布而评测的模型不计其中。而 DeepSeek 则是今年的最大黑马,凭借 V3、R1 等新模型的持续发布迅速上升,在模型维度榜单中排到第 4,成为最具成长性的国内机构之一。
2025-04-18 13:55:49
5119
转载 微软抵制Cursor?新版C/C++插件不给用,只因它不是“官方 VS Code”!
没错,就是这一行代码。确实有,比如 Clangd 插件,它是开源的,做的事情跟微软的 C++ 插件类似。其实,微软的态度其实一直很清晰:虽然它把 VS Code 的核心代码(Code-OSS)开源了,但真正发布的 VS Code 产品是“加料版”,带了微软定制内容,是闭源的,也只能在它自家产品中使用插件市场。有不少开发者反馈,Cursor 的使用受阻,主要是这款工具里面本来可以正常使用的微软官方插件,比如 C 和 C++ 语言服务扩展,突然用不了了,尤其是在更新到插件的新版本后就出现了兼容性问题。
2025-04-16 16:21:14
404
转载 中国移动发布云智算系列产品与智算一体机等多项战略性创新成果
展望未来,中国移动将继续加大研发投入,通过中央企业算力网络创新联合体汇聚产学研用共同发力,响应“人工智能+”“中小企业数字化赋能”等政策的要求,为千行百业提供更高效、更智能的智算服务,谱写数字强国发展新篇章。智算一体机以“硬件为基,软件为核”,以算促智,推动算力从“稀缺资源”变为“普惠服务”,为客户提供私密安全、稳定高效、简单易用的智能引擎服务,陈怀达在论坛致辞中表示,中国移动锚定“世界一流信息服务科技创新公司”定位,大力实施“AI+”行动计划,充分释放AI在技术能力上的规模效应。以云为脉,向智而生。
2025-04-16 16:21:14
218
原创 李彦宏放大招,开发者又能去Create大会薅公开课羊毛了
2025年4月25日,百度一年一度的Create开发者大会即将在武汉开启,邀请到了30+位技术大牛及多位知名教授,为大家带来40节公开课,分为AI探索站、AI工程舱、AI新手营、AI赋能台四大专场
2025-04-15 21:16:22
441
转载 从能力到效率,多管齐下提升大模型智能体系统的智能“密度”
DSEval 专注于数据科学智能体的全生命周期评估,涵盖数据预处理、分析推理和机器学习模型开发等任务,可以评估输出结果的正确性,并且还关注可能出现的副作用,能更全面地反映智能体系统在复杂任务中的表现。大模型的这些特点来自于两个关键能力:一是“推理与规划能力”,让大模型能够对复杂任务进行推理,将其分解为可执行的步骤,并规划行动顺序,进一步体现大模型在调用工具和与环境互动时的能力;在智能体系统的混合架构中,大模型作为核心组成部分,处于更大的生态系统中,与其他程序、环境,甚至其他模型请求紧密相联。
2025-04-15 16:18:07
218
转载 2025中国移动云智算大会 | “云智算杯”AI+应用创新大赛启动
因此,2025年大赛全新升级为“云智算杯”AI+应用创新大赛,以“智汇未来,云创无限”为主题,依托移动云智算平台和一站式大模型服务双技术底座,重点围绕智能体与大模型开发,设立百万现金奖励及百万用云资源支持,加速前沿技术商业化落地。移动赛道聚焦央企数字化转型需求,探索云智融合创新场景,培育行业标杆应用,构建“政产学研用投”协同创新生态。该计划将以“云智算杯”大赛和移动云开放云市场为核心载体,招募百家合作伙伴、遴选百强AI应用,提供百万现金奖励及算力资源补贴,盘活存量伙伴,拓展新AI伙伴,提升参赛积极性。
2025-04-14 18:09:13
238
转载 OpenManus 00后主创现场演示,Agent开发的“快”与“痛” | 万有引力
之后我现在公司的老板就找到了我,问我有没有明确的去向,可以考虑去他们那边。又或者,假设我们设计一个新的智能体,叫 DataAnalysisAgent,这个 Agent 的工具集主要是 Python 相关的工具,以及一些数据分析和可视化的专用工具。在 sync 方法里面,主要做的事情就是调用大模型的 API(利用 function call 或 tool call 的能力),把当前的对话历史、可用的工具列表等信息传给大模型,让大模型判断当前最应该调用哪个工具,并返回选中的工具名称以及需要传递给该工具的参数。
2025-04-11 17:50:13
286
原创 MediaTek举办天玑开发者大会MDDC 2025,联合产业伙伴加速智能体AI体验普及和发展
会上,MediaTek回顾了过往天玑AI先锋计划的丰硕成果,举办“天玑AI先锋计划锐意创新奖”颁奖仪式,以表彰阿里云通义千问、Cocos、抖音、酷狗音乐、快手、美图、面壁智能、全民K歌、腾讯GiiNEX、腾讯会议、腾讯混元、携程旅行等业界知名厂商在AI体验创新上的突出贡献,并邀请业界头部应用厂商、大模型厂商和手机厂商的研发技术专家,分享天玑AI开发套件在端侧AI部署的应用案例和商业价值。此外,MediaTek还推出天玑AI开发套件2.0,深度赋能开发者布局智能体AI用户体验领域。
2025-04-11 11:49:45
969
转载 “MCP 意味着工具平权!”
很难讲千问以及不同模型之间使用的工具是能够共用的,MCP 出现的非常大的价值意义是将工具本身的使用平权化,即对于工具的提供者或供给者而言,它的工具和软件服务,能够更好地被各个模型去使用,这就极大地提升了供应的范围。MCP 的出现价值和意义也取决于:今天大家看到了模型能力的发展,包括千问的 QwQ、业内的 DeepSeek,深度推理的能力不断在发展,使得模型能使用更复杂的工具,这带来了另一个生态的繁荣,模型能使用工具的范围。既有的模型和既有的服务已经为它做好了一定的准备,为什么?这是非常显著的价值点。
2025-04-10 16:41:29
297
转载 当AI成了同事,程序员还能做什么?
著有《AI 辅助编程入门》,译有《AI 辅助编程 Python 实战》《CSS 揭秘》。负责腾讯云开发者AI代码助手产品规划设计与运营,十多年协作 SaaS, SAP 云平台、SuccessFactors HCM、Sybase 数据库、PowerDesigner 等产品的开发经理,在软件架构设计、产品管理和项目工程管理、团队敏捷、AI 研发提效等方面拥有丰富的行业经验。简单来看,MCP 的目标就是通过一套标准化的格式,让开发者像装插件一样接入各种模型和功能,真正实现“模型调用模型”、“AI 协同 AI”
2025-04-10 16:41:29
610
原创 AMD ROCm™ AI开发者交流会——大模型推理与开源创新专场
为促进 AMD ROCm 开发者技术交流,探索大模型与开源工具的实践应用, AMD 将于 4 月 19 日在上海虹桥西郊庄园丽笙大酒店举办 AMD ROCm AI 开发者交流会——大模型推理与开源创新专场活动。
2025-04-10 13:37:32
609
1
转载 2025全球机器学习技术大会最新最全日程来了,一键Get参会指南!
与此同时,大会将聚焦以下十二大专题,全面呈现当前最具突破性与实践价值的 AI 研究与应用成果:大语言模型技术演进、大模型应用开发实践、大模型驱动的软件开发变革、多模态大模型前沿、GenAI 产品创新与探索、AI Infra 大模型基础设施、大模型工程与架构、具身智能与智能硬件、算力基建与性能优化、DeepSeek 技术解析与行业实践、AI 智能体、大模型 + 行业落地实践。无论你是科研学者、技术专家,还是行业从业者,都将在这里收获前沿洞见和实践经验,共同推动 AI 时代的技术变革与应用落地。
2025-04-09 10:03:19
357
转载 Claude深度“开盒”,看大模型的“大脑”到底如何运作?
这种跨语言的共享机制在更大规模的模型中表现得更明显,例如,Claude 3.5 Haiku 在不同语言之间共享的特征比例,是小型模型的两倍以上。我们通过将相同的句子翻译成多种语言,并追踪 Claude 的处理方式,发现其内部存在一致的概念映射,这表明它可能具备某种通用的“思维语言”。确定好目标词后,它再撰写前面的内容,使句子自然地以该词结尾。例如,如果我们将 Claude 的“德州”概念替换为“加州”,Claude 的答案就会变成“萨克拉门托”,进一步证明了它的推理是基于内部逻辑推导,而非单纯的记忆。
2025-04-09 10:03:19
199
转载 强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
Garden Leave”翻译成中文叫“花园假”,最早起源于英国,原意是指公司允许员工在离职交接期间回家“养花种菜”,避免他们接触敏感数据或挖走团队成员。在谷歌 DeepMind,这个机制被用到了极致——甚至是延长版的“高级。因此,他们选择用竞业协议来打防守战,不惜花大钱“封印”前员工,以延迟对手的发展节奏——换个角度,你可以理解为 DeepMind 正在用资金为自己。而在英国,情况就完全不同——英国法律允许执行“合理”范围内的竞业协议,如果雇主能证明其条款对保护商业利益有必要,法院一般不会推翻——。
2025-04-08 18:28:18
178
转载 AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
更令人担忧的是,该推理模型还学会了在思维链中隐藏自己的作弊行为,使负责监督的 GPT-4o 无法再通过思维链检测其异常。自 2022 年底面向公众推出以来,大语言模型(LLM)已屡次暴露出令人不安的行为模式:从常规的说谎作弊、隐藏操纵行为,到更极端的威胁要杀人、窃取核武器密码,甚至还策划了一场致命的疫情……由于很难判断 AI 的思维链是否被篡改,OpenAI 研究人员建议:所有使用推理模型的开发者,应避免对其思维链施加强监督——尤其是在 AI 未来可能达到或超过人类智能的情况下,这一点尤为关键。
2025-04-08 18:28:18
158
原创 开源轻量级AI神器OpenPAI:零门槛构建企业级智能应用
本文介绍了一款开源的轻量化AI应用开发工具OpenPAI及其使用方法。作为一站式AI生产力平台,OpenPAI通过零门槛对话交互、多模型接入、工作流构建、可视化RAG和私有化部署,让复杂的大模型技术快速落地成智能化的AI应用。
2025-04-07 19:44:37
1126
转载 警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
更令人担忧的是,该推理模型还学会了在思维链中隐藏自己的作弊行为,使负责监督的 GPT-4o 无法再通过思维链检测其异常。自 2022 年底面向公众推出以来,大语言模型(LLM)已屡次暴露出令人不安的行为模式:从常规的说谎作弊、隐藏操纵行为,到更极端的威胁要杀人、窃取核武器密码,甚至还策划了一场致命的疫情……由于很难判断 AI 的思维链是否被篡改,OpenAI 研究人员建议:所有使用推理模型的开发者,应避免对其思维链施加强监督——尤其是在 AI 未来可能达到或超过人类智能的情况下,这一点尤为关键。
2025-04-03 10:17:40
221
1
转载 蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ
与此同时,上文提及的 Light-R1-7B-DS 核心开发者、360 智脑算法资深专家邹昊晟将亲临大会,带来题为《开源推理模型的课程学习与 GRPO 数据心得和训练策略》的精彩分享。3 月的最后一天,由蚂蚁与清华大学交叉信息研究院吴翼老师团队联合推出的开源强化学习框架 AReaL 发布了里程碑版本——AReaL boba,正如其昵称“boba”(珍珠奶茶)所寓意的那样,AReaL 团队希望他们的工作能像美味且平易近人的奶茶一样,普惠整个 AI 开发社区,让每一位开发者都能轻松驾驭强大的推理模型。
2025-04-03 10:17:40
300
转载 00后程序员当道!下班3小时“爆肝” OpenManus背后的故事
本科毕业于西南交通大学应用物理系,DeepWisdom 算法研究员,特工宇宙学术负责人,阿里全球数赛 AI 赛道第二,AFlow 一作(ICLR 2025 oral),SPO 一作,OpenManus 核心作者。横空出世,迅速爆火!它凭借云端自主执行、多智能体协同、持续学习与记忆等核心能力,无需过多的人工干预,就能直接交付完整的成果,也可以灵活调用各类工具,不仅能。《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。,利用自己的时间写代码,探索 AI 的更多可能,只为让智能体工具触手可及。
2025-04-02 16:12:27
215
转载 从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让开发者直呼“终于有人讲透技术本质”。作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。DeepSeek R1 的开源引发了学术界和工业界对其复现研究的热潮,也为探索更强大的“深度思考”模型提供了新的视角。▲2024全球机器学习技术大会展区盛况。
2025-03-31 14:55:51
283
转载 成本驱动的精细系统优化,蚂蚁技术专家解密大模型推理优化秘籍|ML-Summit 2025
近日,蚂蚁集团在 AI 模型训练技术上取得突破,结合“专家混合机器学习”方法,在混合算力的系统下,依然能保证模型性能,并进一步降低训练成本。与此同时,在由 CSDN & Boolan 联合举办的 2025 全球机器学习技术大会上,来自蚂蚁的资深算法专家李龙飞将带来《性能驱动的大模型架构探索——网络架构及推理架构》的精彩分享,深入剖析蚂蚁在降低大模型应用成本方面的探索与实践。模型架构:基于对密集模型和 MoE 模型缩放规律的综合分析,蚂蚁团队选择与可用计算资源最匹配的架构,实现了资源利用率的最大化。
2025-03-31 10:29:31
320
转载 抛弃 OpenAI 后,Figure 机器人“进化”:像人一样行走!
为了实现这一目标,工程师们构建了一个高度逼真的物理模拟环境,其中,数以千计的 Figure 02 机器人并联运行,每个机器人都有其独特的物理参数。通过将域随机化与高频扭矩反馈控制相结合,Figure 成功地实现了零样本迁移(Zero-Shot Transfer),即无需额外的微调,在模拟环境中训练出的策略可以直接应用于真实的 Figure 02 机器人上。如何实现更自然的人机交互?在模拟环境中,随机化每个机器人的物理属性,模拟各种可能出现的系统变化,使得训练出的策略能够适应真实世界中机器人之间的差异。
2025-03-28 11:42:48
267
转载 大模型和具身智能究竟是什么关系?
它会主动询问你的情况,并根据你的反馈给出一些缓解压力的建议,如播放一些舒缓的音乐或者有趣的视频。以家用服务机器人为例,当它在执行清洁任务时,需要根据房间的布局、家具的摆放、地面的材质等因素,动态规划最优的清洁路径。举个例子,当你在使用智能音箱时,它不会只机械地回答你的问题,而会用轻松愉悦的语气与你聊天,会关心你的感受,会在恰当的时候给你一些鼓励和安慰。机器人需要理解“收拾”“玩具”“盒子”等词语的含义,也需要将语言命令映射到具体的动作序列,还需要在执行过程中实时感知环境的变化,动态调整自己的行为。
2025-03-28 11:42:48
257
转载 HF、NVIDIA、Google、阿里、智源、宇树科技齐聚GOSIM AI Paris 2025,共掀开源浪潮!
来自 Linux 基金会、PyTorch基金会、Hugging Face 、NVIDIA、Google、阿里、BAAI、TiDB、宇树科技、MiniMax、Dify、面壁智能、牛津大学、北京大学等。汇聚来自HuggingFace、BAAl和CSDN、MiniMax、面壁智能、Oxen.ai、牛津大学的资深专家,全方位剖析AI模型从数据集的精心策划、基础设施的搭建,到训练与RL微调的优化。聚集业界专家、学者和开发者,围绕全球开发者广泛关注的5大领域,共同探讨前沿技术的最新进展、应用案例以及未来趋势。
2025-03-27 17:36:28
268
转载 长文本向量模型在4K Tokens 之外形同盲区?
我们准备了十本公版书,每本都至少有 5 万个词元(tokens),我们从每本书里随机抽取一些短小的片段(每个片段不超过 250 个词元),然后把这些片段拼接起来,形成不同长度的“上下文”,长度分别是 128、256、512、1024、2048、4096 和 8192 个词元。总的来说,我们的研究表明,像 jina-embeddings-v3 这样的向量模型,处理短文本很有一套,但要处理那些需要深入理解语义的长文本,还是力不从心。结果发现,上下文越长,模型的结果就越接近瞎猜,跟随便挑一段没用的文本差不多。
2025-03-27 10:24:35
183
转载 大厂竞相押注人形机器人,我们距离通用还有多远?
之前曾担任SAIC Zone Tech的首席自动驾驶科学家,上海大学的客座教授,Black Sesame Technology的自动驾驶研究副总裁,Singulato USA的董事长。创办微博账号“爱可可-爱生活”,聚焦人工智能主题,以专业的学术品位、广阔的领域视野、敏锐的业界观察、丰富优质的资源推荐,为广大人工智能、机器学习和数据科学爱好者所熟悉和喜爱。人形机器人之所以成为当前最受关注的具身智能形态,主要因为它们契合人类社会的环境需求——建筑、工具、交互方式,几乎所有基础设施都围绕人类身体设计。
2025-03-27 10:24:35
221
原创 超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
这种表达在过去很困难,因为工具门槛高,而未来30年是自我表达的30年,我们要用AI把人类创作的门槛降得足够低,让人们更充分地实现自我表达。来,上难度,点击高级模式,Mureka 平台一键“以曲生曲”,选择或上传参考的音频,Mureka 也能根据你想要的音乐生成新的音乐了。如果你想更进一步定制更多音乐内容,Mureka 作为业内首批正式提供多种 API 服务的 AI 音乐生成工具,开发者可以直接调用 Mureka 的 API 生成歌曲,同时可以上传自己的私有数据微调模型,让模型生成符合数据特征风格的歌曲。
2025-03-26 18:21:08
1164
转载 大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI 代码能力的提升,会加剧程序员的焦虑,还是带来新机遇?马斯克推出的 Grok 3,给人的第一印象就是“豪横”——凭借 20 万张 GPU 堆出的模型,在数学、科学和编程等基准测试中,超越了 Google 的 Gemini Flash Thinking、DeepSeek V3、Claude,以及 OpenAI GPT-4o。他们说模型学会了工具调用,但实际上,Prompt 设计很简单,只是告诉它前面有个类似 Game Boy 的设备,可以选择按 A、B、X、Y、上下左右等键,再结合多模态能力操作游戏。
2025-03-25 09:46:50
378
转载 2025人工智能系列活动全景透视,慕尼黑上海电子展邀您共探未来!
汇聚学术界、产业界的专家、资深学者以及优秀企业代表,围绕下一代AI芯片架构设计的技术挑战与趋势、数据安全与隐私保护、AI 与存储的联合挑战等核心议题,展开深度研讨与经验分享,为行业提供极具价值的交流平台与决策参考,助力推动AI产业迈向更高的发展阶段。半导体、传感器、电源、测试测量、半导体智造、人工智能、人形机器人、分销商、无源器件、显示、连接器、开关、线束线缆、印刷电路板、电子制造服务。,专注于最新的人形机器人技术,核心部件的协同支持及应用行业市场及应用场景,共同探讨人形机器人在各个领域的应用与发展。
2025-03-25 09:46:50
181
原创 OpenAI研究负责人诺姆·布朗:基准测试比数字大小毫无意义,未来靠token成本衡量模型智能|GTC 2025
而人类的力量,与强大的推理模型相结合,意味着你将拥有一个强大的团队,来帮助你解决最复杂的问题,帮助你理清最棘手的问题。所以我对未来,真的非常乐观。因此,在那种模式下,当你考虑如何构建系统,以及如何使用系统的平衡时,你会发现,大部分的计算资源,都投入到了构建系统本身,而使用系统则相对简单直接。当然,任何强大的技术,都存在风险,既有积极的一面,也有消极的一面。我相信,这些模型最终将能够,正如布莱恩所说,增强人类的能力,与人类形成互补,促进科学进步,实现那些原本不可能实现,或者需要花费更长时间才能实现的突破。
2025-03-24 16:40:08
945
转载 小红书技术专家解密语音识别与推荐算法,干货满满|ML Summit 2025
目前,他在小红书负责语音识别与合成、语音交互、音乐技术在小红书全场景下的研发及落地,并主导打造了基于大模型的语音/音乐技术前沿综合解决方案 FireRed。他将分享在小红书这种社区推荐场景下,如何利用大模型技术,结合用户行为,提升内容理解能力,解决内容快速冷启动、精准的目标建模、内容去中心化分发的问题,以及如何利用 LLM 的推理能力,更好地结合用户的画像、行为和消费场景,可解释地实现兴趣的探索、打破信息茧房。在本次大会上,解奉龙博士将带来《FireRed-基于大模型的语音/音乐技术综合实践》的精彩演讲。
2025-03-24 16:40:08
194
原创 杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
如果让人来阅读这么多文本,即使是阅读速度很快的人,也需要超过 40 万年的时间,因为这几乎相当于互联网上所有文本的总量,现在,心理学家告诉我们,一个四岁的孩子,总共清醒的时间大约是 16000 个小时,而且我们通过视神经,每秒钟大约有 2 兆字节的数据进入视觉皮层,大概每秒 2 兆字节。它基本上就是一个去噪自编码器,很像 U-Net 用的那种,就是说你拿一张图片,通过移除其中的一部分,实际上是很大一部分,来破坏它,然后你训练一个巨大的神经网络,基本上在像素级别,或者 token 级别,重建出完整的图像。
2025-03-21 14:52:04
7320
3
认知智能技术与产业研究报告2023
2023-07-07
2018 AI开发者大会全日程
2018-11-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人