自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(4950)
  • 收藏
  • 关注

转载 上海内推 | 中国电信人工智能研究院招聘大模型具身智能算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中国电信人工智能研究院中国电信人工智能研究院(TeleAl)由中国电信 CTO、首席科学家李学龙教授牵头组建并出任院长。TeleAl 面向国家战略需求和未来人工智能发展趋势,结合中国电信在算力、数据、应用场景及通信等多方面的优势,围绕大模型、具身智能、智传网、AI Infra等...

2024-09-20 22:43:56 206

原创 Softmax后传:寻找Top-K的光滑近似

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络Softmax,顾名思义是“soft 的 max”,是 算子(准确来说是 )的光滑近似,它通过指数归一化将任意向量 转化为分量非负且和为1的新向量,并允许我们通过温度参数来调节它与 (的 one hot 形式)的近似程度。除了指数归一化外,我们此前在《通向概率分布之路:盘点Softmax及其替代...

2024-09-20 22:43:56 434

转载 比LoRA更高效!上交大提出LoRA-Dash:释放特定任务方向性能的微调方法

©PaperWeekly 原创 · 作者 |Chong Jie单位 | 上海交通大学研究方向 |参数高效微调我们于 2024 年 9 月 2 日在 arXiv 提交了我们最新的工作——LoRA-Dash:文章链接:https://arxiv.org/abs/2409.01035代码链接:https://github.com/Chongjie-Si/Subspace-Tuning项目主页:htt...

2024-09-20 22:43:56 35

转载 科研实习 | 北京大学黄松芳老师招收大语言模型/具身智能方向科研实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学工学院(College of Engineering,PKU)位于北京市,是中国知名大学工学教学科研机构。学院始建于1910年,称为工科分科大学,并于2005年6月重新组建,拥有力学与空天技术系、航空航天工程系、能源与资源工程系、生物医学工程系、材料与科学与工程...

2024-09-19 13:45:14 122

转载 248篇文献!复旦、南洋理工联合发布综述:面向软件工程的AI智能体最新进展...

©作者 |刘俊伟、王恺欣等单位 |复旦大学CodeWisdom团队来源 |机器之心自从首个全自动 AI 软件工程师 Devin 问世以来,面向软件工程的 AI 智能体广受关注、层出不穷,例如最近的 Genie、Replit、Cursor 等,它们正在对传统软件开发的范式产生着深刻影响。基于大模型的 AI 智能体(LLM-based Agents,后简称 Agent)通过增强推理、记忆、规划以...

2024-09-19 13:45:14 49

转载 ACL 2024 | 通往高秩LoRA的螺旋:更少的参数,保持更高的秩

©作者 | 何浩楠单位 | 中国科学技术大学研究方向 | AI4Science这是一篇非常精彩的论文,文中提出的 MeLoRA 算法不仅实现了秩的提升,并且在计算效率等方面相比“香草味”LoRA 也有一定的提升。虽然本文的理论比较简单,数学公式也不多,但是具体方法让人有眼前一亮之感。文章标题:MELoRA: Mini-Ensemble Low-Rank Adapters for Parameter...

2024-09-19 13:45:14 30

转载 北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

©作者 |陈博远、邱天异、吉嘉铭单位 |北京大学对齐与交互实验室来源 |机器之心OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题,明确的正确答案> ,再加上类似 AlphaGo 中 MCTS 和 RL 的方法直接搜索,只要提供足够的计算量用于搜索,总可以搜到最后的正确路径。然而,这样只是建立起问题和答案...

2024-09-18 12:46:53 284

转载 博士申请 | 澳门大学郑哲东教授课题组招收人工智能全奖博士/RA/博后

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!澳门大学澳门大学是澳门唯一一所国际化综合性公立大学,创立于1981年,位于澳门氹仔大学大马路,共设立有3个国家重点实验室:中药质量研究国家重点实验室、模拟与混合信号超大规模集成电路国家重点实验室、智慧城市物联网国家重点实验室。本课题组与智慧城市物联网国家重点实验室有紧密合作。澳...

2024-09-18 12:46:53 281

转载 ​智慧城市迎来ChatGPT时刻?港大联手百度开源基座模型OpenCity

导读在城市规划和交通管理的领域,精确的交通预测被认为是极为重要的一环。这不仅能够使资源得到更合理的配置,还能大大提升市民的出行体验。然而,目前的预测模型在面对未知区域的预测和长期预测任务时,往往力不从心。现有的挑战主要是由于交通数据在时间和空间上的复杂异质性。为此,本研究开发了名为 OpenCity 的新型基础模型,该模型通过结合最新的 Transformer 架构和图神经网络技术,能够在不同城市...

2024-09-18 12:46:53 28

转载 顶刊TPAMI 2024!北理等提出FreqFusion,让CVPR投稿轻松涨点

©PaperWeekly 原创 ·作者 |知凡单位 |北京理工大学研究方向 |图像检测分割大家是不是埋头准备 CVPR 2025 的投稿苦于涨点困难?快来看看热气腾腾的新鲜TPAMI 2024 论文:论文标题:Frequency-aware Feature Fusion for Dense Image Prediction论文链接:https://www.arxiv.org/abs/24...

2024-09-17 20:34:02 88

原创 低秩近似之路:伪逆(Pseudo Inverse)

©PaperWeekly 原创 ·作者 |苏剑林单位 |科学空间研究方向 |NLP、神经网络可能很多读者跟笔者一样,对矩阵的低秩近似有种熟悉而又陌生的感觉。熟悉是因为,低秩近似的概念和意义都不难理解,加之目前诸如 LoRA 等基于低秩近似的微调技术遍地开花,让低秩近似的概念在耳濡目染间就已经深入人心;然而,低秩近似所覆盖的内容非常广,在低秩近似相关的论文中时常能看到一些不熟悉但又让我们叹为...

2024-09-17 20:34:02 577

转载 3D点云学习新架构!PointRWKV联合RWKV,刷新点云表征学习性能及FLOPs

Transformer 彻底改变了点云学习任务,但其二次复杂度阻碍了其向长序列的扩展,这给有限的计算资源带来了负担。最近出现的 RWKV 是一种新型的深度序列模型,在 NLP 任务中显示出序列建模的巨大潜力。在这项工作中提出了 PointRWKV,这是一种线性复杂度的新模型,具有 3D 点云学习任务所需的适应性。通过对不同点云学习任务的大量实验表明,所提出的 PointRWKV 优于基于 tran...

2024-09-17 20:34:02 52

原创 生成-理解大一统:一文浅谈多模态大模型最新研究进展

在过去几年中,多模态智能的两个关键支柱——理解和生成,取得了显著进展。多模态大型语言模型(MLLMs),如 LLaVA,在视觉语言任务(例如视觉问答)中表现出色。同时,去噪扩散概率模型(DDPMs)在文本到图像/视频生成方面也取得了前所未有的成果。尽管在各自领域取得了这些成就,研究者们开始探索将这两者连接的潜力。近期的研究尝试将来自不同领域的专家模型组合成一个统一系统,以同时处理多模态理解和生成。...

2024-09-13 22:15:21 726

转载 ACL 2024 | 文本表示新SOTA!微软用大模型及其生成数据优化Text Embedding

©作者 |json和Jason论文链接:https://arxiv.org/pdf/2401.00368技术报告:https://arxiv.org/pdf/2402.05672背景首先作者强调了 embedding 即文本表示的重要性:embedding 对于文本匹配 /qa 以及搜广推都应用很广,最近 rag 也很多依赖于 embedding 来检索。然后简单介绍了文本表示的做法,最简单就是...

2024-09-13 22:15:21 89

转载 北京/新加坡内推 | 昆仑2050研究院颜水成团队招聘大模型研究实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!昆仑万维2050研究院昆仑万维2050研究院致力于开展AI前沿研究,其方向包括:1)下一代 Foundation Model 的基础研究和研发;2)智能体的研发和智能体进化的研究;3)生物智能等前沿技术领域的探索。昆仑万维将全球研究院命名为 2050,意在跨越「奇点」,探索未知...

2024-09-13 22:15:21 149

转载 文末送书 | 豆瓣9.9分!深度学习神作“鱼书”系列第四弹强化学习来了

2018 年,第一次在日亚的网站上看到这本书时,完全被评论吸睛了,评论阵容大概是这样的。这本被日本网友称为“神本”(即神作)的深度学习入门书,当年原版上市不到两年销量就突破了 10 万册,评论更是一致好评。“好懂、压倒性好懂、好懂得可怕!就连文科生都能看懂。”在中文版出版后,这本书同样很受欢迎,目前累计销量已经达到 10万+册。真的印证了那句:“这是一本真正意义上的深度学习书。”这个神作就是深度学...

2024-09-12 20:05:03 138

原创 “闭门造车”之多模态思路浅谈:位置编码

©PaperWeekly 原创 ·作者 |苏剑林单位 |科学空间研究方向 |NLP、神经网络在前面的文章中,我们曾表达过这样的观点:多模态 LLM 相比纯文本 LLM 的主要差异在于,前者甚至还没有形成一个公认为标准的方法论。这里的方法论,不仅包括之前讨论的生成和训练策略,还包括一些基础架构的设计,比如本文要谈的“多模态位置编码”。对于这个主题,我们之前在《Transformer升级之路:...

2024-09-12 20:05:03 797

转载 博士申请 | 西湖大学LINs Lab招收大语言模型方向博士/访问学生/RA/博后

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!西湖大学西湖大学工学院学习与推理系统实验室(Learning and INference Systems Laboratory,LINs Lab),专注于深度学习优化与泛化的理论研究,并致力于将理论结果应用于高效(efficiency)和可靠(robustness)的学习与推理...

2024-09-12 20:05:03 238

转载 ACL 2024杰出论文:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM测试集

©作者 |金川杨、舒天民单位 |Johns Hopkins University心智能力(Theory of Mind,ToM),即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方...

2024-09-12 20:05:03 68

转载 博士申请 | 美国西北大学Manling Li招收NLP/CV/AI方向全奖博士/博后/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!Northwestern UniversityNorthwestern University是美国著名顶尖私校,长期稳居美国top 10,世界top 30。地处Evanston,属于芝加哥北郊富人区那块,环境好也安全。学校极其漂亮,有两块private beach给教工/学生。...

2024-09-11 12:34:38 288

转载 OCR研究不曾结束,它才刚刚开始——GOT-OCR-2.0模型开源!

▲ 图1. 通用OCR模型须“通用”论文标题:General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model论文地址:https://arxiv.org/abs/2409.01704项目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0OCR 一直是离落地最近的研究方向之一,是 AI-...

2024-09-11 12:34:38 319

转载 膜拜!YOLO-World这下是真的杀疯了!直接加速20倍!

多模态时代,开放词汇目标检测,正在超越Faster R-CNN、DETR、YOLOs等传统方法,成为极具潜力的研究方向,近两年顶会创新也层出不穷,腾讯重磅发布不久的YOLO-World,便是一种先进的开放词汇检测器,基于简洁高效的YOLOv8架构,通过视觉语言建模,以及大规模数据集的预训练,能够识别并定位训练集中未出现的新类别物体,具备超强的零样本及泛化性能,部署轻便!为了帮助大家掌握YOLO-W...

2024-09-10 13:05:38 136

转载 300篇文献!大模型走向物理世界:TeleAI发布大模型驱动的具身智能综述

近年来,大模型在人工智能领域掀起了一场革命,各种文本、图像、多模态大模型层出不穷,已经深深地改变了人们的工作和生活方式。另一方面,在国际半导体大会上,英伟达创始人黄仁勋表示,人工智能下一个浪潮将是 “具身智能”,即能理解、推理、并与物理世界互动的智能系统。近年来,国内外商业巨头也纷纷推出自己的具身机器人发展计划。大模型和具身智能,无疑是当前人工智能领域最闪耀的双子星。在光电感知技术、机器人技术、大...

2024-09-10 13:05:38 142

转载 3D分割里程碑!SAM2Point联合SAM2,首次实现任意3D场景、任意Prompt的分割

文章链接:https://arxiv.org/pdf/2408.16768在线Demo:https://huggingface.co/spaces/ZiyuG/SAM2Point代码链接:https://github.com/ZiyuGuo99/SAM2Point▲ 图1 SAM2POINT 的分割范式重点概述:无需投影到 2D 的 SAM 2 分割方案:SAM2POINT 通过将 3D 数据体...

2024-09-10 13:05:38 209

转载 ECCV 2024 | JHU提出X-Gaussian,首个可渲染X光的三维高斯泼溅方法

©PaperWeekly 原创 ·作者 | 蔡元昊,Alan Yuille单位 |Johns Hopkins University研究方向 |计算机视觉本文介绍我们在 ECCV 2024 上的新工作《Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis》。论文链接:https://arxiv.org/abs...

2024-09-08 23:51:22 419

转载 挑战当前最难、规模最大多模态评测基准MME-RealWorld,QwenVL-2位列第一但并未及格...

32 个标注者,29,429 条标注数据,图像平均分辨率 20001500,当前最难最大的纯手工标注图像感知 benchmark 来了!现有模型没有一个在总分上取得 60% 以上的准确率。论文链接:https://arxiv.org/abs/2408.13257项目主页:https://mme-realworld.github.io/代码链接:https://github.com/yfzhang1...

2024-09-08 23:51:22 286

转载 NAACL 2024 | 参考文本在摸鱼?评估任务或许并不需要Ground Truth

©PaperWeekly 原创 ·作者 |Shuqian Sheng单位 |上海交通大学研究方向 |自然语言处理面对文本评估任务时,人们总是习惯性地想找到一个标准答案作为参考。这源自于一个很自然的思路,和参考相似的答案大概率是一个好的答案。许多文本评估方法的实现都是基于这个直觉,例如经典的 BLEU 和 METEOR,例如近年来基于 embedding 相似性提出的 BERTScore 和...

2024-09-06 18:09:12 104

转载 亲测有效!「科研」神器上线:秒写论文笔记,无痛准备组会

自 2023 年 3 月推出第一代语言基座模型 ChatGLM 以来,智谱 AI 在大模型的性能和模态上不断探索并取得显著进展。经过多次技术迭代和性能优化,智谱 AI 在 2024 年的 ACM SIGKDD 大会上隆重发布了新一代基座模型。这些模型包括 GLM-4-Plus、CogView-3-Plus、GLM-4V-Plus 等,均在各自领域达到了国际领先水平。我们对刚刚发布的 GLM-4V...

2024-09-06 18:09:12 191 1

转载 博士申请 | 中关村实验室陈力副研究员招收大模型/网络空间安全方向联培博士...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中关村实验室中关村实验室是中央管理的国家网络信息领域的新型科研事业单位。中关村实验室主体位于中关村科学城北区。中关村实验室聚焦国家网络信息领域的重大目标使命,开展战略性、前瞻性、基础性重大科学问题和关键核心技术研究;探索新型科研机构管理体制机制创新;聚焦培育高端创新人才,推动网...

2024-09-06 18:09:12 377

转载 直播预告 | 南方科技大学魏鸿鑫课题组:现代深度学习的可靠性和隐私保护

AI安全说 第2期嘉宾在线解读✔️在线实时Q&A✔️直播主题现代深度学习的可靠性和隐私保护直播嘉宾王朔远南方科技大学在读博士生刘真龙南方科技大学在读博士生直播时间2024年09月07日(周六)10:00-11:00观看方式PaperWeekly视频号PaperWeekly B站直播间一键预约直播▼报告介绍01面向开放视觉语言任务的置信度校准在近年来,视觉语言模型(V...

2024-09-05 21:18:53 108

转载 仅一层参数提速500倍!上交大提出简单高效的半监督图嵌入算法

©PaperWeekly 原创 ·作者 |Jianwu Zheng单位 |上海交通大学研究方向 |数据管理与人工智能近年来,神经网络(深度学习)主导了人工智能领域,并推动了大模型技术的蓬勃发展。然而,该论文引发了两个看似不相关却极具启发性的问题,可能会改变我们对现有技术的看法。论文标题:From Cluster Assumption to Graph Convolution: Graph-...

2024-09-05 21:18:53 79

转载 小模型杀疯了!仅4B参数性能超GPT-3.5!无限长文本性能超Kimi

端侧 ChatGPT 时刻到来!旗舰端侧模型面壁「小刚炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能,强得不像端侧模型。并且,量化后仅 2GB 内存,端侧友好。这还是一款瑞士军刀般全面开挂的基座模型,一口气带来:无限长文本,榜单性能超越 Kimi,超长文本也不崩;性能比肩 GPT-4o 的端侧最强 Function Call...

2024-09-05 21:18:53 201

转载 ICML 2024 | 从拓扑视角出发,10行代码提升类别不平衡图节点分类

©PaperWeekly 原创 ·作者 |刘芷宁单位 |伊利诺伊大学香槟分校研究方向 |可信机器学习本文简短介绍一下我们最近被 ICML 2024 接受的工作,欢迎讨论/试用/star : )论文标题:Class-Imbalanced Graph Learning without Class Rebalancing论文地址:https://arxiv.org/abs/2308.14181代...

2024-09-04 13:32:36 286

转载 将MoE塞到LoRA:一篇文章的诞生

©PaperWeekly 原创 ·作者 |Taki单位 |香港大学研究方向 |LLM efficiency, trustworthyNothing will work unless you do.——Maya Angelou本文主要介绍一篇论文是怎么诞生。文章基本信息如下:论文标题:Mixture-of-Subspaces in Low-Rank Adaptation论文链接:https...

2024-09-04 13:32:36 189

转载 军事科学信息研究中心白晓颖团队2024年人才引进公告

2024-09-04 13:32:36 33

转载 博士申请 | 伦敦国王学院杜雅丽教授招收大模型决策Agent/RL方向博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!伦敦国王学院伦敦国王学院(King's College London,简称King's 或KCL)是英格兰第三古老的学府, 在1829年由英王乔治四世和首相威灵顿公爵于伦敦泰晤士河畔旁所创立,。学院校友有众多诺贝尔奖和图灵奖得主,著名物理学家麦克斯韦曾经在此执教。2023-24...

2024-09-03 12:10:01 293

转载 ​KDD 2024 | 南大提出AutoMTL框架:基于神经网络架构搜索的多任务推荐方法

©PaperWeekly 原创 ·作者 |蒋申单位 |南京大学PASA大数据实验室研究方向 |自动化机器学习、推荐系统论文标题:Automatic Multi-Task Learning Framework with Neural Architecture Search in Recommendations论文地址:https://dl.acm.org/doi/10.1145/363752...

2024-09-03 12:10:01 278

转载 深度学习还不如浅层网络?RL教父Sutton持续反向传播算法登Nature

©作者 |机器之心编辑部来源|机器之心人工神经网络、深度学习方法和反向传播算法构成了现代机器学习和人工智能的基础。但现有方法往往是一个阶段更新网络权重,另一个阶段在使用或评估网络时权重保持不变。这与许多需要持续学习的应用程序形成鲜明对比。最近,一篇发表在《nature》杂志上的研究论文《Loss of plasticity in deep continual learning》证明:标准的深...

2024-09-03 12:10:01 209

转载 实测3款AI助手,哪个才是读文献的最佳神器?

引言:大模型时代,我们怎么学术冲浪在大模型浪潮方兴未艾的当下,算法从业者们每天打开 Google Scholar、Arxiv 等学术网站和各类自媒体平台时,迎接他们的都是雪片般飞来的新论文和相关的解读、讨论。据统计,2023 年发表的学术论文中含有“大语言模型”关键词者高达 20900 篇,相比 2022 年几乎翻了 20 倍 [1]。面对这样的信息过载,有一定知识积累的研究者们要跟住最新进展尚不...

2024-09-03 12:10:01 242

转载 ECCV 2024 | 让AI更懂物理世界!人大、北邮等联合提出多模态分割新方法

©作者 |王耀霆单位 |中国人民大学来源 |量子位让 AI 像人类一样借助多模态线索定位感兴趣的物体,有新招了!来自人大高瓴 GeWu-Lab、北邮、上海 AI Lab 等机构的研究人员提出 Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下的指代分割),让 AI 能看、会听,更懂真实物理世界。相关论文已入选顶会 EC...

2024-09-02 13:31:41 218

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除