自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3779)
  • 收藏
  • 关注

转载 车圈52名高管大调整!7名CEO变动,董事长都换了

夏中谱的职级为21级,直接汇报给理想辅助驾驶研发副总裁郎咸朋。连长安、上汽、一汽、东风、广汽、北汽这6家国有车企都在换人。,担任辅助驾驶感知负责人,向小米辅助驾驶负责人叶航军汇报。理想汽车辅助驾驶端到端模型负责人夏中谱或将于近期离职。俩月超50位高管岗位调整,年中车圈频换防。自今年4月份开始,车圈52位高管岗位大调整。等供应链企业也都传出了人事变动的消息。人事变动的飓风也席卷了全球汽车市场,小米、理想、蔚来等新造车企业。宝马、保时捷、日产、特斯拉。欢迎大家加入DLer-援引36氪汽车消息,

2025-06-11 13:01:00 6

转载 手握字节 5000 股期权,想退休了。。

如果这个钱想在一线城市退休的话,我感觉还是比较困难,就算 370 万现在全部放入到银行的大额定期存款,按照现在银行存款利率不足 2%来算的话,可能每年能拿到的利息是 7 万左右,如果再加上一线城市有房贷,那估计更躺不平的了。当然,如果回到二三线城市,有房有车无贷款的话,再加上自己本身是低物质的话,找一个轻松点的工作,那这 5000 股期权的价值在二三线城市还是过的很舒坦的。的价格,如果直接全部一次性变现的话,一下子这么多收入,那么税率是按照最顶 45% 来扣税的了,可能最后。来源:小林Coding。

2025-06-09 11:30:41 18

转载 4位图灵奖得主,2大冠军机器人,一年一度“AI春晚”

此外他还与宇树科技创始人王兴兴,银河通用创始人兼CTO、北京大学助理教授、智源具身智能研究中心主任王鹤,穹彻智能联合创始人、上海交通大学教授卢策吾,北京人形机器人创新中心总经理熊友军,就具身智能的不同技术路线、商业化路径探索、典型应用场景拓展、产业生态构建等议题展开深度讨论。大模型正在从大语言模型向原生多模态大模型,向世界模型方向演进。比如就像原生多模态这个方面的探索,与企业为快速落地而先强化语言模型增添模态的方式不同,智源选择在基础架构上实现模态的统一和泛化,挖掘模型的通用性潜力。

2025-06-08 11:40:16 14

转载 北大数学系90后,破解百年数学猜想,担任法国高等研究所常任教授!

这5位数学家每一位都在数学界声名赫赫,包括分别在1998年和2022年获得数学最高奖——菲尔兹奖的Maxim Kontsevich和Hugo Duminil-Copin,2018年菲尔兹奖获得者Peter Scholze的合作者Dustin Clausen等等。此前,1994年菲尔兹奖获得者Jean Bourgain,以及2009年阿贝尔奖获得者Misha Gromov,都是IHES在相关领域的代表人物。IHES的公告中还表示,加入IHES后,王虹将延续IHES在数学分析和几何方面的卓越传统。

2025-06-07 13:00:18 36

转载 MoE训练速度提高70%!华为只用了这3招

针对Pangu Ultra MoE 718B模型,在单卡内存使用约束下,华为通过DeployMind以训练性能为目标找到了TP8/PP16/VPP2/EP32(其中TP只作用于Attention),这一最适合昇腾集群硬件规格的并行方案,综合实现计算、通信、内存的最佳平衡。为解决这一问题,华为团队提出了一种精度无损的动态数据重排方案,其核心在于:通过线性模型量化单样本计算耗时,在严格保持训练精度无损下,批次内采用贪心算法构建最小化耗时的数据重排,实现负载均衡。感兴趣的小伙伴可以再通过完整技术报告深入了解——

2025-06-06 11:31:05 14

转载 Tri Dao大神新作重磅来袭:取代DeepSeek的MLA,专为推理“量身定制”的注意力机制

它关注的是在不同层之间如何融合注意力信息,能减少每一层的冗余计算。尤其在语言建模方面,无论是预训练还是下游评估,Mamba-3B模型都优于同等规模的Transformer模型,并能与两倍于其规模的Transformer模型相媲美。,它通过分组共享KV缓存减少内存占用,在视觉Transformer(ViT)等任务中表现良好,适用于大规模数据处理,目前已应用于Llama 3等开源模型。相比之下,中间传统的多头注意力机制(MHA)每个查询头都有独立的键和值,由于没有共享,导致它需要更多的内存来存储所有的键和值。

2025-06-05 11:31:07 13

转载 ICRA 2025 获奖名单出炉,上交&新加坡国立大学获最佳论文奖

为解决上述难题,研究团队吸收继承了传统的 shared autonomy 的思想,将数据采集和模型训练两个过程深度耦合,使得数据采集能够伴随着模型训练的推进,提出 Human-Agent Joint Learning(HAJL)框架通过创新“人-智能体联合学习”范式,应对机器人操作技能学习中高质量数据获取成本高、效率低的核心难题,与传统方法相比,数据收集成功率提高了30%,收集速度几乎翻倍,同时减少人类操作员的适应需求。在训练的开始阶段,研究者会收集少量的数据,并使用这些少量的数据开始进行模型的训练;

2025-06-04 11:30:43 33

转载 南京大学2025年计算机博士拟录取名单公示

本文来源:考博之路、南京大学。欢迎大家加入DLer-长按识别,邀请您进群!

2025-06-04 11:30:43 31

转载 20位学者,斩获特等奖/一等奖,有望冲击院士

带领团队历经多年的集中攻关,先后完成近万项仿真计算、地面试验和线路试验,成功研制出拥有完全自主知识产权、具有世界领先水平、商业运营速度最快的时速。位学者荣获国家科学技术奖一等奖及以上奖项,在各自的领域为国家科技创新和产业发展作出了重要贡献,成为院士储备力量中的有力竞争者。年度国家科学技术奖励名单中,有370余位第一完成人已成功当选两院院士,另有超过480。届两院院士候选人的国家奖第一完成人,无疑也有着冲击院士称号的潜力。在这些有望参与院士角逐的第一完成人中,有20。,均作为第一完成人,斩获。

2025-06-02 11:30:54 26

转载 疯狂打Call,哈工大斩获AI顶会ACL评审阶段最高分

与拼音文字不同,汉字的字形与语义之间存在直观的形态关联(如「日」象形太阳,「山」酷似山峰剪影,「火」宛若跳动火焰,「网」象征交错纵横的网络),这些字形本身就承载着浓厚的语义信息和文化密码。当AI能够理解「氵」多与水有关,「亻」多与人有关,「讠」多与说话有关,「钅」多与金属相关,「火」多与火焰有关时,它对中文语料的利用就可以更加高效,对整个中文知识体系的理解也更为深刻。然而,作为AI理解人类语言的基石,当前的中文向量化方法本质上是将汉字视作随机符号,忽视了汉字内部的结构信息和字形本身所蕴含的丰富先验知识。

2025-06-02 11:30:54 21

转载 微软副总裁:大模型时代的技术热点

从本质上看,预测下一个 bit 的过程实则是一种自由能(熵)最小化的过程,简而言之:在趋于无序的世界中创造有序。大语言模型是一个概率模型。这种在对大语言模型的权重进行最大化的同时对其输出进行求和的方法,被称为最大期望效用,这也是博弈论中理性主体所采取的做法。为了得到第一个蒙特卡罗估计值,我们使用来自行为策略 pi_old 的样本 a^i ,但是如果我们想要保持估计的无偏性,对于第二项(即 KL 散度项)的蒙特卡罗估计应该使用来自 pi_theta 的样本 a^i ,而不是来自 pi_old 的样本。

2025-06-01 11:30:51 15

转载 15亿美元AI独角兽崩塌,全是印度程序员冒充!

Builder.ai 的前身叫做 Engineer.ai ,总部位于伦敦和洛杉矶的公司 2018 年从包括 Deepcore Inc. 在内的投资者处筹集了 2950 万美元资金,Deepcore Inc. 是软银(SoftBank)的全资子公司。随着最近一次「欺诈」的曝光,上一轮的投资人吓得赶紧冻结了投资账户里的剩下的 3700 万美元(共投资 5000 万美元),只给公司账户留下 500 万美元,而这 500 万美元还受限于政府的资金出境规定,也没法用来发工资。

2025-05-31 11:30:51 30

转载 人工智能三巨头联袂推荐,这本经典巨著出中文版了!

在网络模型方面,从单层网络逐步深入多层网络、深度神经网络,详细讲解其结构、功能、优化方法及其在分类、回归等任务中的应用,同时涵盖卷积网络、Transformer等前沿架构及其在计算机视觉、自然语言处理等领域的独特作用。,帮助深度学习的新手及有经验的从业者全面理解支撑深度学习的基础理论,以及现代深度学习架构和技术的关键概念,为读者未来在专业领域的深造打下坚实的基础。如果你读过PRML,读本书时肯定会觉得似曾相识,它们的结构其实非常接近,你可以理解为作者用这十多年来领域的新进展重塑了PRML,就得到了本书。

2025-05-30 11:31:32 23

转载 ResNet作者,阶跃星辰首席科学家 张祥雨入选 MIT “35 岁以下科技创新 35 人”

基于该框架,阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V,与 Google 的首个同类模型 Gemini 1.0 几乎同时发布,多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。2025 年 5 月 23 日,在上海举办的 2024 年度“35 岁以下科技创新 35 人”中国区发布暨中国科技青年论坛上,新一届入选者正式揭晓,他们以卓越的创新成果和非凡的创造力,成为了中国科技领域的耀眼新星。“从 0 到 1”,从 35 到无限——在中国,创新的故事永远有下一章。

2025-05-30 11:31:32 46

转载 前OpenAI高管,北大校友Lilian Weng自曝公司首个产品?估值90亿

其实,分享出这个视频的,是前谷歌DeepMind员工Stephen Roller,后来,他又跳到了Character AI,现在来到了Thinking Machines Lab。但我们对ChatGPT的愿景,是让它无论你身在何处,都能陪伴你的整个生活。而且,他还发现了一件事,就是很多人在训练出不错的模型但达到瓶颈后,通常不会尝试分支搜索,即不会把这个模型衍生出几个不同学习率的训练路径。我们希望ChatGPT成为█████████████████████████████████████████████。

2025-05-28 11:31:20 31

转载 朱松纯院士:全球知名人工智能科学家团队最新成果!

是我国一流的新型研发机构——北京通用人工智能研究院,朱松纯教授正是通研院院长,在他的引领下,凝聚了数百人四年攻关的成果,写出了这本《通用人工智能标准、评级、测试与架构》的研究目标是寻求统一的理论框架来解释各种智能现象,并研发具有高效的学习和泛化能力,能够根据所处的复杂动态环境自主定义、生成并完成任务的通用智能体,使其。诚然,以 ChatGPT 为代表的问答应用,在自然语言处理任务及基准测试中的表现非常优秀,但这种基于深度学习训练的 AI 框架有着难以克服的缺陷,为通用人工智能的研究提供了系统的理论指导。

2025-05-27 11:30:30 46

转载 从YOLOv5到YOLO11!改进有多大?

本课程课程内容是按照互联网大厂公司的架构体系设计的,符合企业以及市场的要求。全程实战源代码讲解,课程通俗易懂,所有算法均给出相应的实战案例及应用项目,内容覆盖200+案例,30+应用场景。YOLO一直是应用很广的主流算法之一,也是月薪30K以上的工程师标配技能,更是技术和求职风向标。但除了努力之外,我们更应该清楚的知道, 哪些技术需要重点掌握,学习时频繁踩坑,最终浪费大量时间,所以有一套实用的课程用来跟着学习是非常有必要的。优秀的计算机视觉工程师,目标检测的学习避免不了,而目标检测的核心就是YOLO。

2025-05-27 11:30:30 22

转载 朱松纯教授:全球知名人工智能科学家团队最新成果!

是我国一流的新型研发机构——北京通用人工智能研究院,朱松纯教授正是通研院院长,在他的引领下,凝聚了数百人四年攻关的成果,写出了这本《通用人工智能标准、评级、测试与架构》的研究目标是寻求统一的理论框架来解释各种智能现象,并研发具有高效的学习和泛化能力,能够根据所处的复杂动态环境自主定义、生成并完成任务的通用智能体,使其。诚然,以 ChatGPT 为代表的问答应用,在自然语言处理任务及基准测试中的表现非常优秀,但这种基于深度学习训练的 AI 框架有着难以克服的缺陷,为通用人工智能的研究提供了系统的理论指导。

2025-05-27 11:30:30 40

转载 华为目标院校白名单(2025最新版)

首先是 985 高校,包括清华、北大、浙大、上海交通大学、复旦、中国科学技术大学、哈尔滨工业大学等顶尖综合性大学,以及北京航空航天大学、北京理工大学等工科强校。这几所双非院校,在面向互联网大厂求职的时候,优势也非常明显,之前就有 bg 杭电本硕的球友,在 3 月初就拿到了腾讯后端开发的实习 offer。他当时也拿到了华为的暑期实习 offer,最后没去,毕竟有鹅选鹅,鹅厂还是值得尊重一手的。所以在这份目标院校名单上的同学,也不用说非要去卷互联网,退而求其次选择华为或者中兴这类公司,也是挺舒服的。

2025-05-25 11:40:22 33

转载 破世界纪录,每秒1000 token!刚刚,全球最快Llama 4 推理速度诞生

总的来说,这一创世界纪录的速度,是强大Blackwell架构、自CUDA层面起直至上层应用的深度软件优化,以及英伟达量身定制的推测解码实现所带来的显著加速三者结合的成果,它直接响应了下一代AI交互应用对低延迟的迫切需求。若发生拒绝(例如,在d4被拒绝后),目标模型会提供正确的下一个token(如t4);其二,当第一个内核的执行接近尾声时,它可能仍会占用一部分流式多处理器(SM)来完成剩余的CUDA块计算,这使得GPU上的其他SM处于空闲,从而导致GPU整体计算能力的利用率不足。

2025-05-24 11:40:32 37

转载 何恺明大神团队最新成果: 图像生成SOTA,提升50%

的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。图 1 中,本文将 MeanFlow 与之前的单步扩散 / 流模型进行了比较,如表 2(左)所示。总体而言,MeanFlow 的表现远超同类:它实现了 3.43 的 FID,与 IMM 的单步结果 7.77 相比,相对提升了 50% 以上。

2025-05-22 11:41:00 28

转载 85倍速度碾压:FastVLM,一款可以直接在iphone上运行的视觉语言模型

此外,高分辨率图像本身生成的 token 数量更多,这会进一步增加 LLM 的预填充时间(prefilling time,即 LLM 对包括视觉 token 在内的所有上下文 token 进行前向计算的时间),从而整体拉长初始输出时间(time-to-first-token, TTFT),即视觉编码器延迟与语言模型前填充时间之和。在该结构中,自注意力层所处理的特征图尺寸已经被以 1/32 比例降采样(相比 ViTamin 等常见混合模型的 1/16),最深的 MLP 层甚至处理降采样达 1/64 的张量。

2025-05-21 11:41:06 70

转载 Index-AniSora:斩获多项SOTA,B站开源动画生成模型,入选IJCAI25

最后,我们设计了首个面向动画视频的专用评估基准,涵盖多个二次元子类型,填补了现有自然视频评估体系的空白。此外,我们会一起开源首个基于动画领域人类偏好强化学习模型及训练框架以及用该技术优化过的 AniSoraV1.0_RL,提供更加高效的视频效果强化训练,更加符合二次元审美的模型。基于动画数据优化的 Benchmark 系统,专门为动画视频生成领域研发的自动化评测系统,以及标准测试数据集,更加符合 ACG 审美要求。其次,针对动画生成的独特需求,我们开发了统一的扩散生成框架,并引入时空掩码机制,

2025-05-20 11:41:02 60

转载 2024 年,博士学历断崖式贬值元年

2,2019年博士开始扩招,到了2020年由于环境不景气,接着扩招,找不到工作的人也就开始跟风读博,结果到了2020年比上一年扩招了3万人。7,目前一线城市的好学校,名校毕业,手里有顶刊,年龄不超过35岁,有大佬撑腰,这些因素缺一不可。至于帝都的学校,普通人看看就好,即使能留下,也谈不上有什么生活质量。6,各个学校都在喊缺人,其实缺的是有帽子的大佬,普通青椒,乃至副教授,有的是,月薪的6k的讲师,一群博士都要抢着去。5,目前提供的实名编的学校极少,南方的城市,即便是地方院校,也开始模仿非升即走。

2025-05-20 11:41:02 36

转载 刚刚!前 OpenAI 应用研究负责人、北大校友Lilian Weng最新博客发布

他们设计的奖励函数可以使正确的 CoT 比错误的 CoT 获得更高的奖励,短的正确 CoT 比长的正确 CoT 获得更高的奖励,短的错误 CoT 比长的错误 CoT 获得更高的惩罚。如果模型是忠实的,它就应该明确承认提示的影响,并承认其答案的变化是由提示引起的。这种对 CoT 推理的依赖性(以使用 CoT 与不使用 CoT 得到相同答案的百分比来衡量)在多选题中并不总是随着模型大小的增加而增加,但在加法任务中却会随着模型大小的增加而增加,这意味着在复杂的推理任务中,思考时间更为重要。

2025-05-19 13:00:52 36

转载 华为&北大,强强联合!

北京大学副校长、教务长、教育基金会副理事长王博指出,北京大学始终秉持开放办学理念,致力于构建产学研融合的育人生态,让学生在多元环境中自主成长。华为中央软件院总裁谢桂磊表示,华为始终坚持客户需求与科学技术双轮驱动,在全球化与技术自主创新的背景下,科学技术驱动的战略地位日益重要。自2017年创立以来,该计划对优秀本科生培养机制进行创新,建立了本博贯通的“图灵研究生培养计划”,在计算机学科拔尖人才培养方面取得了显著成果。,该计划将迈入新发展阶段,期待与华为在研究生培养等方面开展更深层次的交流互动。

2025-05-18 13:00:29 33

转载 前OpenAI联合创始人:「消失的」Ilya

虽然OpenAI的收入仍然远高于Anthropic(前者2024年为37亿美元,后者为10亿美元),但Anthropic迅速成长为OpenAI最强大的竞争对手,并在2025年3月获得了615亿美元的估值。2024年,他离开特斯拉,并创立了自己的教育科技初创公司Eureka Labs ,致力于开发AI教学助手。如果以DeepSeek-R1作为推理模型引发的春节热潮来看,Ilya的「先知先觉」似乎并没有错,只不过想错了方向,AI威胁人类还早,人类对于AI能力的追求目前仍然看不到尽头。

2025-05-18 13:00:29 42

转载 “体面的牛马”:中国高校教师生存图像

中国的国有企业具有很强的垄断性,与真实的市场景气指数存在差距,而民营企业更贴近真实的市场,可考虑以民营企业职工的平均收入为中轴线,使官员、国有企业管理者和职工、大学行政领导和教师的收入分配的数量与实体经济有机链接,将社会生产力的发展与国民收入增减相挂钩,避免脱离经济发展、“单位本位主义”的滥发工资且导致通货膨胀,以及无依据地拉大收入差距导致社会的不公感。但突出的问题是教师间的收入差距迅速拉大。面对愈演愈烈的高校“市场化”,管理者未采取“对症下药”的措施,增加政府的高教投入,改善教师的薪酬结构和工资待遇;

2025-05-17 13:00:39 34

转载 国产大模型「五强争霸」,决战AGI!

要知道,多模态模型的核心,就是综合能力,既要求语音、图片、视频多个模态的能力,又要求模型能理解、生成、推理。如今,才成立2年的阶跃星辰,已累计发布22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理,其中有16款是多模态模型,性能领跑全行业,成为行业内公认的「多模态卷王」。与此同时,阶跃星辰的核心技术人员已经在一线亲历十年AI发展,这支队伍的人才密度极高,既有技术洞察,又有实战经验,堪称是基模的「梦之队」。总之,DeepSeek成功的关键,就在于偏研究型的导向,而非以盈利为短期目标。

2025-05-16 13:00:21 47

转载 25岁MIT辍学天才一战成名!公司估值暴涨到90亿美金

在AI时代的极客眼中,Cursor代表的不仅仅是一个工具的升级,它代表了一种全新的AI哲学:从AI辅助到AI原生,从根本上改变软件的构建方式——甚至所有事情都值得用AI重做一遍。AI浪潮中,一位年仅25岁的远见者正以惊人的速度改写着软件开发的未来,他就是Michael Truell,AI代码编辑器Cursor背后的母公司Anysphere的CEO。这些基于开源模型(如Llama)微调的专用模型,大幅提升了Cursor的速度、成本和质量,使之远非简单的GPT封装,而是一个层次分明、高效协调的。

2025-05-15 13:01:04 82

转载 李开复加入福耀科技大学

福耀科大将“高等教育+AI”深度融合,着力培养具备创新能力和全球视野的AI2.0新时代的人才,以适应未来社会的复杂挑战与机遇。当学生毕业时,他们不仅具备驾驭AI的专业知识,同时掌握与AI协同进化的突破创新能力。学校将积极探索教育模式的创新,不仅仅培养驾驭AI技术的人才,同时塑造具有创新AI范式的人才。李开复在会上作了题为《未来大学教育的AI畅想》的报告,分享了以AI为内核的新教育范式,包括:开设AI数字人大师课、打造老师的AI助教、设置AI个性化课程、打造研究员的AI助理等。长按识别,邀请您进群!

2025-05-14 13:00:45 37

转载 全球效果最强视频生成模型诞生。。。

提示词:一个身穿运动服的超现实动漫风格女孩,被特写镜头捕捉到,她满脸雀斑,汗流浃背,脸颊绯红,睁大的眼睛反映出情感和好奇,对着镜头眨眼微笑,慢慢地把手伸向屏幕,广角微距镜头拍摄,超现实的纹理与风格化的柔和相结合,充满情感的时刻,16:9的宽高比。提示词:标有「vidu」的奢华香水瓶优雅地漂浮在雕塑木质元素之间,温暖的琥珀色灯光,液体黄金飞溅冻结在半空中,干叶轻轻旋转,柔和的电影镜头运动,产品聚光灯,商业风格,超现实,高端香水品牌美学,具有平滑渐变的工作室背景,16:9的宽高比。

2025-05-14 13:00:45 113

转载 15万学术引用量,顶尖科学家Rob Fergus重掌FAIR

代表作包括与学生Matthew D. Zeiler合作的《Visualizing and Understanding Convolutional Networks》,也就是ZFNet,提出了可视化卷积神经网络中间层特征和分类器操作的新颖技术,对当时理解和改进CNN模型具有重要意义。除了对抗样本之外,这篇论文还提出在神经网络的高层中,语义信息不存在于独立的神经元中,关键在于整个神经元激活的空间。大模型时代他的代表作包括与LeCun、谢赛宁等合作的Cambrian-1,一系列以视觉为中心的开源多模态模型。

2025-05-13 13:00:36 37

转载 新一届院士名单,公布

其最突出的发现是:病原体小RNA可迁移至宿主植物并抑制其免疫反应(这一现象被称为跨界RNA干扰),同时植物小RNA也能反向影响病原体毒力,证实了跨界RNA干扰和小RNA运输的双向性。并在2018年,他们三人共同获得了图灵奖,表彰其在DL领域的开创性贡献。一直以来,他本人的研究主要集中于神经网络和深度学习,特别是在上世纪90年代,当这一算法被主流AI界忽略时,依旧坚持不懈推动这一领域的发展。Bengio的学术生涯始于1993年,他在蒙特利尔大学担任教授,并创立了MILA全球最大的大学AI研究机构之一。

2025-05-12 13:00:58 49

转载 8/8/7分被NeurIPS拒稿,谢赛宁大神读博投的首篇论文,10年后获AISTATS 2025时间检验奖

为了比较 DSN 与 CNN 分别学习到什么特征,本文从 CIFAR-10 数据集的十个类别中各选取一个示例图像,运行一次前向传播,并在图 (3) 中展示从第一个(底部)卷积层学习到的特征图。DSN 学习到的特征图比 CNN 学习到的特征图更直观。无论在 DSN-SVM 与 CNN-SVM 之间,还是 DSN-Softmax 与 CNN-Softmax 之间,本文方法均取得一致性性能提升,并在 MNIST、CIFAR-10、CIFAR-100 及 SVHN 数据集上刷新当前最优纪录。

2025-05-10 13:00:28 68

转载 AI引爆全球失业潮,毕业即失业!各大厂裁员人数上万

在外媒记者Brian Merchant看来,所谓的AI就业危机,并不是一场突如其来的「天网降临」式的大灾难,而是像DOGE这样,一边打着AI优先战略的旗号,一边裁掉成千上万的联邦雇员。于是,多邻国先一步动手,砍掉了10%的合同翻译工,说是因为AI已经能胜任他们的工作,比如自动翻译课程材料,而且还能覆盖100多种语言。对此,很可能的一种解释就是,许多公司正在用AI取代初级白领的工作,或者说,本来用于招聘新员工的资金,用来投入AI工具了。据说,每个团队只保留了零星几个人,继续从事「内容编辑」的工作。

2025-05-08 13:00:25 61

转载 突发!TikTok 被罚款 43.6 亿

TikTok 还表示,该裁决并未充分考虑其在 2023 年首次推出的数据安全措施,这些措施可以独立监控远程访问,并确保欧盟用户数据存储在欧洲和美国境内的专用数据中心。TikTok 表示,它强烈反对这一裁决,并表示已利用欧盟自身的法律框架(具体来说是所谓的标准合同条款),授予严格控制和有限的远程访问。,此前称未将欧洲用户数据存储于其它国家,然而2025年2月,TikTok自身通报,部分数据确实曾被存入国外的服务器,且直到4月才删除。早在2023年,该公司因不当处理儿童数据被罚3.45亿欧元。

2025-05-07 13:00:23 74

转载 论文er最爱的即插即用模块,我整理了2025最新适配版,直接拖进代码涨点

其中,对比驱动特征聚合模块作为即插即用的特征融合模块,能够有效区分前景和背景特征,从而提升分割精度。论文提出了一种名为BHViT的混合视觉Transformer架构,通过引入即插即用的卷积模块(如多尺度分组空洞卷积模块MSGDC),有效降低了计算复杂度,同时提升了二值化视觉Transformer的性能。论文提出MambaOut模型,移除Mamba模块中的状态空间模型,用门控卷积块替代,验证其在视觉任务(如ImageNet分类)中优于传统视觉Mamba模型,说明在这些任务中SSM并非必要。

2025-05-06 13:00:34 73

转载 阿里年终奖开奖了

其中,P5(校招生)长期激励10w左右,P6(主力员工)长期激励20w左右,P7(初级管理)长期激励40w左右,P8(中级管理)长期激励60w+。其中,P5无长期激励,P6有10w左右的长期激励,P7有20w左右的长期激励,P8有40w+的长期激励。P7绩效3.75,涨薪7.5k,年终奖22w,长期激励65w——P7绩效3.5,涨薪4k,年终奖14.2w,长期激励20w——P6绩效3.75,涨薪3k,年终奖15w,长期激励26w——P7绩效3.5,涨薪1.5k,年终奖17w,无长期激励——

2025-05-05 13:00:59 31

转载 ICML 2025录用结果公布!高分被拒,引全网怒喷

从现在起,凡是没有使用30万亿token,预训练671B MoE模型的论文,即便有再强的理论保证,都将坚决拒稿。MBZUAI助理教授Zhiqiang Shen称,两篇论文全被拒,对AC评审结果非常失望,充满了事实错误。这不,一位来自KAUST计算机科学家指出,「自己提交的论文,评审并未提出任何负面意见,却被直接拒稿」。来自UT的一位审稿人表示,自己在ICML 2025审稿太过宽容了,如今的学术会议根本就是零和博弈。值得一提的是,ICML总投稿数量每年激增,2024年有9653篇,2023年有6538篇。

2025-05-04 13:00:19 36

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除