自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(4650)
  • 收藏
  • 关注

转载 打通智能体「自我进化」全流程!复旦推出通用智能体平台AgentGym

©作者 |复旦大学来源 |机器之心AI 通用智能体的自我进化能力,并非遥不可及。LLM-based Agent,已经不再需要人类监督者的帮助,开始实现「自我进化」!这个智能体在学习了专家轨迹以后,获得了基础的通用能力,能够在更广泛、更真实的未知环境与任务上进行探索和学习,在外部的反馈下不断提升自己。最近,复旦大学语言与视觉团队推出的 AgentGym 平台,打通了大语言模型智能体「数据采样、训...

2024-06-16 13:05:02 12

转载 ACL 2024 | 大语言模型的安全对齐会适得其反?无需训练便能逆转安全对齐

©PaperWeekly 原创 ·作者 |周展辉单位 |上海人工智能实验室研究方向 |语言模型安全对齐论文链接:https://arxiv.org/abs/2402.12343代码链接:https://github.com/ZHZisZZ/emulated-disalignment这项工作介绍了一种无需训练的攻击方法,通过访问语言模型的输出分布,即可逆转安全对齐,将更强的对齐结果转化为更大...

2024-06-16 13:05:02 2

转载 惊呆!大模型工程师月薪快10w了!

最近几个月,各个机构与企业开始大刀阔斧招揽 AI 人才。6月13日,苹果也宣布与OpenAI合作,苹果产品将全方面集成 GPT,正式迈入 AI 智能时代。不仅如此,国内头部的人工智能公司已经开始用AI数字人助力各行各业,央企+交互数字人将成今年一整年的趋势。几乎所有的知名大厂也都在布局AI市场。根据各大招聘网站的数据,能够熟练使用AI技术,懂大模型的程序员,年薪已经翻倍,甚至近100w !风口之下...

2024-06-15 13:15:16 12

转载 北航等提出超大规模多语言代码评测基准,涵盖40种编程语言

为了更加全面的探究大语言模型的代码能力,该工作提出了一个涵盖 40 种编程语言的大规模多语言多任务代码评测基准(McEval),包含了 16000 个测试样本。评测结果表明开源模型与 GPT-4 相比,在多语言的编程能力上仍然存在较大差距,绝大多数开源模型甚至无法超越 GPT-3.5。此外测试也表明开源模型中如 Codestral,DeepSeek-Coder,CodeQwen 以及一些衍生模型也...

2024-06-15 13:15:16 12

转载 ACL 2024 | 多模态大模型能揭示图像背后的深意吗?

©PaperWeekly 原创 ·作者 |杨奕欣单位 |北京大学博士生研究方向 |自然语言处理论文题目:Can Large Multimodel Models Uncover Deep Semantics Behind Images?论文链接:https://arxiv.org/abs/2402.11281v2Github链接:https://github.com/AnnaYang2020...

2024-06-15 13:15:16 9

转载 博士申请 | 香港科技大学邵琪佳老师招收普适计算/人机交互全奖博士/RA/访问学生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学香港科技大学(The Hong Kong University of Science and Technology, 简称HKUST或港科大)是位于香港新界西贡区大埔仔的一所公立顶尖研究型大学。根据2025年的QS世界大学排名,港科大位列全球第47位。在学科排名方面...

2024-06-15 13:15:16 48

转载 已开源!可控视频生成新SOTA,给定参考人物图像即可定制高质量跳舞视频

随着视频生成技术的不断进步,可控跳舞视频合成也逐渐成为一项非常有吸引力的任务,受到了很多研究者的关注。给定一张参考人物图像和一段人体姿态序列,该任务旨在生成遵循给定的条件的时序连续且高保真的视频。最近,来自华中科技大学、阿里巴巴、中国科学技术大学的研究团队提出了一种名为 UniAnimate 的全新框架,通过统一视频扩散模型来实现高效且长时的跳舞视频生成。该框架克服了目前可控跳舞视频合成领域高效性...

2024-06-14 13:22:14 22

转载 智源联合多所高校推出首个多任务长视频评测基准MLVU

TL;DR: 当前,研究社区亟需全面可靠的长视频理解评估基准,以解决现有视频理解评测基准在视频长度不足、类型和任务单一等方面的局限性。因此,智源联合北邮、北大和浙大等多所高校提出首个多任务长视频理解评测基准 MLVU(A Comprehensive Benchmark for Multi-Task Long Video Understanding)。MLVU 拥有充足且灵活可变的的视频长度、包含多...

2024-06-14 13:22:14 18

转载 北京/上海内推 | ​地平线招聘多模态感知算法工程师/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!地平线地平线 (Horizon Robotics) 是市场领先的乘用车高级辅助驾驶(ADAS)和高阶自动驾驶(AD)解决方案供应商,拥有专有的软硬件技术。我们的解决方案整合了领先的算法、专用的软件和先进的处理硬件,为高级辅助和高阶自动驾驶提供核心技术,从而提高驾驶员和乘客的安全...

2024-06-14 13:22:14 62

转载 港大、北大等发布最新综述:一文解析生成技术在时空数据挖掘中的应用

本文聚焦于将生成技术整合到时空数据挖掘中,考虑到时空数据的显著增长和多样性。随着 RNN、CNN 和其他非生成技术的进步,研究人员已经探索了它们在捕捉时空数据中的时间和空间依赖关系方面的应用。然而,生成技术如大规模语言模型(LLMs)、扩散模型(Diffusion)、自监督学习(SSL)、序列到序列(Seq2Seq)模型和扩散模型的出现,为进一步增强时空数据挖掘开辟了新的可能性。本文对基于生成技术...

2024-06-14 13:22:14 15

转载 博士申请 | 加州大学默塞德分校王艺炜老师招收NLP/LLM方向全奖博士/RA/实习生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!UC Merced加利福尼亚大学默塞德分校(UC Merced)是美国加利福尼亚大学系统的一部分,位于美国加利福尼亚州中部的默塞德市。该校是加州大学系统中最年轻的一所,学校发展迅速,2023 US News美国大学排名第60名。UC Merced以其在计算机科学科学、生物科学等...

2024-06-13 13:13:58 146

转载 ICML 2024 | 即插即用、快速适配!港大发布全新智慧交通时空预测模型FlashST

代码链接:https://github.com/HKUDS/FlashST论文链接:https://arxiv.org/abs/2405.17898实验室链接:https://sites.google.com/view/chaoh导读交通预测的目标是准确预测和分析城市未来的交通模式,这一过程需要同时考虑时间和空间因素。然而,分布偏移的存在在这一领域构成了一个重大挑战,因为现有模型在面对与训练分布显...

2024-06-13 13:13:58 23

转载 错过等一年!2024智源大会完整日程公布,全球大模型先锋集结

6月14-15日,2024智源大会将再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。本次大会将汇聚OpenAI、DeepMind、Meta、微软、斯坦福、UC Berkeley等国内外顶尖机构及技术团队代表,并邀请包括Sora、GPT、Llama、Gemini等AI领域重要项目作者参与交流。本届大会将以线下与线上结合的形式召开,线下会场位于中关村国家自主创新示范区展示中...

2024-06-13 13:13:58 29

转载 北大联合字节提出多模态评估流程ConBench:揭示VLM的不一致性

多模态大模型(LVLMs)取得了快速的进展,在处理视觉信息方面展现出了很强的感知和推理能力。然而,当面对不同规模解空间的问题时,LVLMs 在相同知识点上并不总能给出一致的答案,这种答案的不一致性在 LVLMs 中普遍存在,在一定程度上会损害实际的用户体验,然而现有的多模态大模型基准测试却忽视了关于一致性的评价。针对这一问题,北京大学计算机学院联合字节跳动提出了 ConBench,弥补了这一缺陷。...

2024-06-13 13:13:58 7

转载 KDD 2024 | GPT-4搞不定的图推理任务,港科大7B模型轻松搞定

©作者 |陈诺单位 |香港科技大学来源 |量子位大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程?先来看GPT-4的表现:给出了一个非常简短且错误的答案(判断该图中没有环),这可能是由于模型在处理长输入时的局限性,或者是对图的复杂结构理解错误所致。这显示了大型模型在适应图论问题时面临的挑战。相比之下,港科大团队开发的GraphWiz不仅给出了正...

2024-06-12 13:36:02 21

转载 什么年代了还在用Nerf/Gaussian?视频扩散模型通向生成式新视点渲染

©PaperWeekly 原创 ·作者 |朱智宇单位|香港城市大学博士研究方向 |计算机视觉论文标题:NVS-Solver: Video Diffusion Model as Zero-Shot Novel View Synthesizer论文链接:https://arxiv.org/abs/2405.15364Github链接:https://github.com/ZHU-Zhiyu/...

2024-06-12 13:36:02 24

转载 北京内推 | ​北京智源人工智能研究院AI系统组招聘算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!智源研究院北京智源人工智能研究院(简称“智源研究院”)是人工智能领域的新型研发机构。2018年11月14日,在科技部和北京市支持下,联合北京多家人工智能领域优势单位共建。作为新型研发机构,智源研究院初步探索了“集中力量办大事,青年人才挑大梁,开放生态育创新”的科研组织模式。通过...

2024-06-12 13:36:02 106

转载 用LLM发了两篇水刊,会成为学术污点吗?

如今大模型席卷AI界,已经成为所有人工智能的从业者都要入局的领域。今天给大家梳理6个LLM热门方向。都是行业前沿与顶会大热,容易出idea,想冲顶会或者水paper都可以看一下。6个LLM热门方向(附对应最新论文代码)- 多模态大模型 144篇- 大模型+agent 158篇- 大模型+时序 23篇- 大模型高效应用 176篇- 大模型+RLHF 31篇- 大模型推理 14篇每个方向我都整理了对应...

2024-06-12 13:36:02 19

转载 ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

©作者 |徐俊东单位 |新加坡国立大学研究方向 |大语言模型推理论文题目:Faithful Logical Reasoning via Symbolic Chain-of-Thought论文作者:徐俊东1,费豪1,潘亮铭2,刘茜3,Mong-Li Lee1,Wynne Hsu1新加坡国立大学1,加州大学圣芭芭拉分校2,奥克兰大学3收录会议:ACL 2024论文链接:https://arxiv...

2024-06-11 13:43:24 47

转载 ICML 2024 | 提升收敛速度!人大提出基于镜像下降的贝叶斯小样本分类

©PaperWeekly 原创 ·作者 |周峰单位 |中国人民大学统计学院本文介绍了中国人民大学统计学院的一篇关于贝叶斯小样本分类加速收敛的文章“Accelerating Convergence in Bayesian Few-Shot Classification”,本文被 ICML 2024 接收,代码已经开源。论文标题:Accelerating Convergence in Bayes...

2024-06-11 13:43:24 27

转载 博士申请 | 香港理工大学林婉瑜老师实验室招收人工智能方向全奖博士/博后

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学(The Hong Kong Polytechnic University) 是一所位于中国香港的公立综合性研究型大学,坐落于香港九龙红磡湾。香港理工大学是香港地区的顶尖高校之一,并长期入选“QS世界百强大学”及“泰晤士高等教育世界百强大学”。在202...

2024-06-11 13:43:24 358

转载 算法岗位真的需要顶会才能入场吗?

现在越来越多的人都开始卷核心会议—顶会论文是提升个人竞争力的最佳加分项之一,But!顶会并不好卷!因为它本身对论文质量就有着非常高的要求,此外,投稿也是一项技术活,不同会议需要设计不同的“故事”。不过别担心,这次我花了5天时间给大家详细整理了这篇【核心会议+期刊汇总+最新JCR影响因子+选刊必备神器】,1W+字干货,看完你会发现,顶会虽然难,但也并没那么高不可攀!扫码回复“顶会攻略”领取【核心会议...

2024-06-11 13:43:24 10

转载 博士申请 | 香港中文大学(深圳)刘圳老师招收AIGC方向博士/硕士/RA

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培养与科学研究。学院在运筹学、统计学、计算机科学等基础领域以及机器学习、运营管理、决策科学等应用领域有着系统的教学体系,为学生提供完整且前沿的理论与实践相结合的教育。学院强调产学研结合,秉承香港中文大学...

2024-06-10 21:27:02 316

转载 “所想即所得”变革3D分割!浙大等团队联合推出基于LLM的3D物品分割

©作者 | 陈天润单位 | 魔芯(湖州)科技有限公司,浙江大学研究方向 | 3D计算机视觉近日,一项名为Reasoning3D的研究,由浙江大学、魔芯科技、中国科学技术大学、新加坡科技设计大学(SUTD)以及湖州大学等机构的科研团队携手推出。这项技术采用多模态大型语言模型(LVLM),实现了一个领域的新突破:仅需简单的自然语言指令,AI 便能精确地识别并划分三维模型的各个组成部分——从此,只需要给...

2024-06-10 21:27:02 23

转载 大模型到底哪家强?达摩院推出“全自动竞技场Auto Arena”评测框架

【????达摩院重磅推出】全球首创的全自动大模型竞技场????Auto Arena of LLMs????来袭!突破传统,首次实现无需人工标注的评测革命。通过大模型出题、大模型辩论、大模型委员会裁定,该方法无需任何人工,却可以达成目前和人类评测结果一致度最高的结果。通过评测发现,国产大模型(minimax,商汤日日新,千问等)表现强劲,在中英文评测中均展现出与 GPT-4 旗鼓相当的实力!????日后,该榜单将实时更新迭...

2024-06-10 21:27:02 122

转载 赋予机器人思考能力!北大提出自纠正多模态大模型,赋能端到端机器人操作...

为了构建机器人的大脑并模仿人类的思维方式,本文创新性地引入了一个机器人自我纠正多模态大模型,名为 Self-Corrected (SC) -MLLM。在机器人场景中,我们的工作首次实现了利用多模态大模型同时预测机械臂末端执行器的操纵位姿,并能自主识别和纠正失败的操作动作。除此之外,基于成功纠正的样本,SC-MLLM 还能进行持续性策略学习,构建了首个闭环自纠正机器人操纵代理框架。该项目由北京大学的...

2024-06-10 21:27:02 27

转载 ICML 2024 | 川大提出外部引导的深度聚类新范式,大幅提升CLIP图像聚类性能

©作者 |李云帆单位|四川大学博士生研究方向|深度聚类怎样才能将可爱又迷人的柯基与柴犬的图像进行区分?如果单从图像识别角度而言,两种犬类在外观上极为相似,拥有相近的色块像素,仅凭数据内蕴信息(即图像自身)可能难以对二者进行区分,但如果借助外部数据和知识,情况可能会大幅改观。近日,一篇以《Image Clustering with External Guidance》为题的论文,提出了能够...

2024-06-07 14:12:24 44

转载 博士申请 | 香港科技大学(广州)陈城老师招收医疗AI方向全奖博士/RA/实习生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学是亚洲以至全球领先的研究学府之一,并被认为是世界上发展最快的大学之一。在2023年,科大位列QS世界大学排名第 40 位。2022年9月,香港科技大学启用广州校区,重点发展交叉学科,以与清水湾校区相互补足。课程设计将围绕信息、功能、系统、社会四个...

2024-06-07 14:12:24 437

转载 文末送书 |《理解图灵》重磅首发:纪念一个改变世界的大脑

“Sometimes it is the people who no one imagines anything of who do the things that no one can imagine.” ―在谈到人类智慧与机器智能的交汇时,我们无法绕过一个闪耀的名字——艾伦·图灵。他是数学家、逻辑学家、密码学家,人工智能先驱。从提出划时代的图灵机和图灵测试,到二战时期破解Enigma,图灵...

2024-06-07 14:12:24 33

转载 大语言模型何时需要检索?UCLA提出全新自监督选择性检索策略

©作者 |吴迪单位|UCLA研究方向 |自然语言处理前言最近一年开始做知识增强语言模型的方向。暑假去到了 AWS AI 的 CodeWhisperer 组实习,在 repository-level code completion 这个任务上进行了一些相关研究,有了一些发现,也投中了一篇 ICML Oral,便把感悟写成此文,希望大家多批评指正。背景2.1 检索增强语言模型(Retrieva...

2024-06-07 14:12:24 30

转载 ICML 2024 | 为什么我们应该做online RLHF/DPO?

©作者 |Wei Xiong单位|UIUC研究方向 |大语言模型对齐偏好学习与对齐去年十月份左右开始写了一篇文章 Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint,文章主要包括两个部分,一个是想要做整个 RLHF 的理论,另...

2024-06-06 13:34:08 64

转载 博后招募 | 清华大学NLP实验室招聘大语言模型方向博士后/研究员

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!清华大学清华大学计算机系自然语言处理与社会人文计算实验室 (THUNLP) 是国内开展自然语言处理研究最早、深具影响力的科研单位,也是国内开展大模型研究最早的团队。团队依托国家实验室平台及孵化企业承担了国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务,并与腾讯、华为...

2024-06-06 13:34:08 393

转载 独自一人,怒发顶会!

万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量和质量无疑是最好的背书。手握一篇甚至多篇高质量的论文,就是学术成果最好的展现,当然它也意味着未来更优质的工作和薪酬。但是论文很多人来说,是一种挑战。大部分同学的困难不是不想发,而是……1、不知该如何对...

2024-06-06 13:34:08 28

转载 腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题

©作者 |机器之心编辑部来源 |机器之心过去十年间,基于随机梯度下降(SGD)的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中,Adam 及其变种最受追捧。无论是 SGD,还是 Adam,亦或是其他优化器,最核心的超参数非 Learning rate 莫属。因此如何调整好 Leanring rate 是炼丹师们从一开始就必学的...

2024-06-06 13:34:08 31

转载 北京内推 | ​AMD北京AI算法团队招聘大语言模型算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!AMDAMD 是高性能与自适应计算领域的领先企业,致力于提供优质的产品和服务,助力客户解决各种重大的挑战。我们的技术推动着数据中心、嵌入式系统、游戏和 PC 市场迈向未来。AMD 于 1969 年在硅谷创立,最初只有几十名员工,从那时起 AMD 便踏上创新之路,致力于引领半导体...

2024-06-05 13:33:42 452

转载 东南大学、蚂蚁提出MATEval:多Agent开放式文本评估框架

©作者 |李煜单位|东南大学硕士研究方向 |知识图谱&大语言模型论文标题:MATEval: A Multi-Agent Discussion Framework for Advancing Open-Ended Text Evaluation论文作者:李煜1*、张沈昱1*、吴锐2、黄修添2、陈永锐1、许文浩2、漆桂林1、闵德海1作者单位:东南大学知识科学与工程实验室、杭州市蚂蚁集团...

2024-06-05 13:33:42 42

转载 剑桥提出RLHF平替方案:在SFT以外,我们还能拿SFT数据做什么?

©作者 | 孙浩单位 |剑桥大学博士生研究方向 | 强化学习我们最近的工作提出 RLHF 的一种廉价/实用的替代方案:Alignment from Demonstrations (AfD) 而非 Alignment from Preference-based Data。引入 Inverse RL trajectory matching 的视角,帮助理解了什么时候应该做 SFT,什么时候应该更进一...

2024-06-05 13:33:42 36

转载 Nature正刊重磅!微软、华盛顿大学发布首个全切片数字病理学模型GigaPath

©作者 |许涵文单位 |华盛顿大学计算机学院博士生研究方向 |计算生物学近年来,数字病理学的蓬勃发展成为了精准医学加速突破的重要组成部分。在癌症护理过程中,利用全切片成像技术将肿瘤组织样本转换为高分辨率的数字图像,已经成为常规技术。高达十亿像素级别的病理学图片包含多样的肿瘤微环境信息,为癌症分型诊断,生存率分析以及精准免疫治疗提供了前所未有的契机。近期,生成式人工智能革命为准确感知、分析病理...

2024-06-04 12:37:42 50

转载 一口气看8页!旷视打造“点读笔”Fox:图文并茂的文档交互式多模态大模型

最近,旷视打造了一支多模态大模型的“点读笔”-Fox,轻松实现对 8 页文档(中英混合,单栏多栏格式混合的极端场景)的交互式感知理解。对于信息密集的 PDF 文档,Fox 支持高可控性的细粒度理解,比如在用户感兴趣区域内进行文字识别、段落翻译以及页面内部的图片内容描述等。“一图胜千言”—— one image token >> one text token。本文中,我们进一步突破了对于...

2024-06-04 12:37:42 32

转载 科研实习 | 清华大学计算机系朱军教授团队招聘音视频生成方向研究型实习生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!清华朱军团队清华大学计算机系朱军教授在机器学习、生成模型方面具有世界一流的科研水平,在国际顶级会议NeurIPS、ICML、ICLR及期刊JMLR、TPAMI、NMI等发表论文百余篇,谷歌引用3万余次。截至目前,朱军老师实验室在扩散模型、内容生成方面取得了多份有影响力的工作,并...

2024-06-04 12:37:42 310

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除