PaperWeekly-CSDN博客

转载 NeurIPS 2024 | 上海AI Lab提出实时检索增强框架，无缝整合任意多模态大模型

©PaperWeekly 原创 ·作者 | 李川皓单位 | 上海人工智能实验室、北京理工大学研究方向 | 多模态大语言模型、互联网检索增强背景随着人工智能的快速发展，大模型已逐步融入人们的日常工作和生活中。众所周知，大模型的训练和微调会消耗大量计算资源和时间，这意味着频繁更新大模型的参数是不切实际的。然而，现实世界中的信息是实时产生的且不断变化的。这使得大模型在完成训练后，对于后续新产生的信息感...

2024-11-15 23:53:01 12

原创如何突破多模态数据瓶颈？阿里通义提出多模态指令进化方法MMEvol

如何突破多模态数据瓶颈？通义实验室提出多模态指令进化方法 MMEvol，实现感知进化、推理进化、交互进化三个维度的同步提升。相较开源多模态 SOTA 模型，在 13 个权威多模态评测集上的 ACC 平均提升了 3%。论文标题：MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct论文作者：林廷恩，罗润，刘雄，武玉...

2024-11-15 23:53:01 483

转载博士申请 | 南洋理工大学王勇老师招收数据可视化/人机交互方向硕士/博士

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南洋理工大学新加坡南洋理工大学是一所科研密集型大学，凭借科学与工程领域的坚实基础与强大优势享誉国际。在最新的QS世界大学排名中，南洋理工大学位列世界第15名，其中计算机科学排名世界第9名，同时南洋理工大学多年蝉联全球年轻大学榜首。南洋理工大学校园环境优美，曾获评“全球十大最美校...

2024-11-15 23:53:01 7

转载北京/杭州/上海内推 | 阿里通义实验室招聘大模型/RAG方向算法实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴阿里巴巴通义实验室招聘日常实习生，Qwen的RAG方向相关技术进行基础研究和应用落地，团队近几年在顶级会议ACL/EMNLP/NAACL/ICLR等发表50+篇论文，登顶多项榜单，在SemEval 22/23连续两次获得最佳论文奖，并在ACL 2023/NLPCC 20...

2024-11-15 23:53:01 4

转载 ICLR 2025满分论文！利用一致光传输提升图像照明编辑效果

引言在当今数字图像处理的背景下，图像照明编辑成为了一个重要且充满挑战的领域。传统的计算机图形学方法通常依赖于物理照明模型来模拟图像的外观，这种方法强调了光源与物体之间的相互作用与反射。然而，随着深度学习和生成模型的发展，基于扩散的图像生成方法逐渐成为处理照明编辑问题的新兴手段。这些方法不仅可以应对更为复杂的“野外”照明效果，还能在图像中灵活地生成各种光照变化，如反向照明、边缘光源、光晕效果等。通过...

2024-11-14 21:05:30 45

转载博后招募 | 南方科技大学荆炳义教授招收统计与机器学习基础理论方向博士后...

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南方科技大学南方科技大学统计与数据科学系成立于2019年4月，以建设国际一流的教育培养和研究基地为目的。本系志在为国家培养出具有扎实的科学基础，思想活跃，创新意识和能力强，有国际视野，脚踏实地，有朝气、有理想的拔尖人才。本系已经建立起本硕博人才培养体系，拥有统计学和数据科学与大...

2024-11-14 21:05:30 18

转载无限批扩展可能么？达摩院Inf-CL打破对比学习显存瓶颈，提效100倍！

达摩院研究员提出了一种对比损失（Contrastive Loss）的高效实现方式（Inf-CL），通过分块计算策略，在单台 A800 机器上就能把 batch size 扩展到 400万。该方案突破了领域内“Contrastive loss 由于显存限制不能放大 batch size”的“共识”，实现了对比损失的 batch size 近乎无限的扩展。论文标题：Breaking the Memor...

2024-11-14 21:05:30 11

转载 Salesforce推出首个通用时序预测模型评测基准GIFT-Eval，助力基础模型研究

时间序列预测在各个领域变得越来越重要，近年来时序基础模型的研究得到广泛关注。然而，一些常用的公开数据集受限于自身数据特点，无法有效评估模型在多样化场景下的通用预测能力。因此构造一个高质量、多样化的评测基准，并对各种模型进行公平评估，对时序基础模型研究领域的发展至关重要。此类基准还有助于确定模型的优势和局限性，推动该领域的进步。为此，来自 Salesforce、新加坡国立大学的研究者引入了 GIFT...

2024-11-14 21:05:30 9

转载 NeurIPS 2024 | 浙大等提出eFreeSplat，基于3DGS的泛化性三维重建方法

最近来自浙江大学和华中师范大学的研究人员提出 eFreeSplat 模型，一种基于 3D 高斯点云表示（3DGS）的泛化性三维重建方法。该方法仅需要两张不同视角和相机参数作为输入，通过一次前馈网络即可输出场景的 3DGS 表示，无需原始 3DGS 方法在单场景上进行长时间的优化。论文标题：Epipolar-Free 3D Gaussian Splatting for Generalizable N...

2024-11-13 13:02:46 22

转载今天面试了一个大厂女生，当场想给她offer！

今天面试了一个大厂女生，有发顶会paper的经验，想当场给她offer！不得不说，有顶会paper经验真的很加分，尤其是大厂！但是 , 写论文之初最难的是找到一个不错的idea，这是非常重要的。一篇论文从课题的确立到文章最终被接收大概会经历以下几个过程：确定课题—调研—阅读文献—idea和实验—撰写初稿和润色—投稿—rebuttal或Eealy Accpeted如何获得足够发top期刊会议的ide...

2024-11-13 13:02:46 13

原创 NeurIPS 2024 | 浸大、CMU提出全新框架COAT，用LLM探寻隐秘的因果世界

©PaperWeekly 原创 ·作者 |Chenxi Liu, Yongqiang Chen单位 |香港浸会大学、CMU、MBZUAI研究方向 |因果关系、基础模型因果发现的现实挑战：稀缺的高级变量寻找并分析因果关系是科学研究中的重要一环，而现有的因果发现算法依赖由专家预先定义的高级变量。现实场景中的原始数据往往是图片、文本等高维非结构化数据，结构化的高级变量是十分稀缺的，导致现有的因...

2024-11-12 13:01:41 767

转载北京/上海/杭州内推 | 小红书交易算法团队招聘多模态/NLP算法工程师/实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！小红书小红书交易算法团队，主要负责小红书电商、直播侧的算法研发，涵盖交易搜索、推荐、增长、内容理解等算法能力。直接面向小红书电商、直播核心业务，技术应用落地场景广泛。团队在人工智能（CV/NLP/Audio/多模态等）、推荐、搜索领域发表过多个国际顶级期刊和会议论文，参加多项国...

2024-11-12 13:01:41 85

转载直聘教授+事业编制！北京985高校人工智能学院海外优青重磅开启，诚邀您依托申报...

北京师范大学实验幼儿园北京师范大学实验小学北京市三帆中学（初中）北师大二附中（高中）滑动查看更多教师办公室研究生工位滑动查看更多

2024-11-12 13:01:41 7

转载 Salesforce推出Moirai-MoE，新视角设计下一代时序基础模型

©PaperWeekly 原创 ·作者 |刘成昊单位 |Salesforce AI Lab时间序列预测是人类理解物理世界变化的重要一环。自去年底以来，时序预测领域正在经历重大转型，从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。目前虽然有不少基础模型已经提出，但如何有效地在高度多样化的时序数据上训练基础模型仍是一个开放问题。近期，来自 Salesforce、新加坡国立大...

2024-11-12 13:01:41 14

原创 NeurIPS 2024 | 南科大、港科大等提出GITA，推进基于视觉语言模型的图推理

©PaperWeekly 原创 ·作者|卫焱滨单位|香港科技大学本文将图结构转化为图片，利用视觉语言模型（VLM）进行一般化地图推理, 开创了“视觉语言图推理”这一属于 VQA 和图推理交叉的子领域。核心贡献 1：GITA 框架；通过自动将图结构转化为文本图描述和视觉图像，使用图文并举的方式，首次实现平滑地将视觉语言模型纳入图推理的赛道与基于文本的大模型进行竞争，并揭示了视觉语言模型在使...

2024-11-11 12:33:07 535

转载墨大、复旦等开源代码大模型OpenCoder构建指南，性能媲美专有模型

论文链接：https://arxiv.org/abs/2411.049051 引言大型语言模型（LLMs）在代码相关任务中的重要性日益凸显。随着技术的不断进步，这些模型在代码生成、推理任务和代理系统等多个领域都展示了卓越的性能。然而，目前开源LLM仍存在一定的局限性，特别是在模型的透明度和可重复性方面。尽管一些开源代码LLM逐渐接近专有模型的性能水平，但仍然缺乏高质量的代码LLM，尤其是在严谨科学...

2024-11-10 20:17:02 49

原创 NeurIPS 2024 | 浙大提出Ex-MCR，参数高效的通用多模态统一表征构建范式

引言多模态对比表征（Multi-model Contrastive Representations）学习的目的是在共享表征空间内对齐来自不同模态的输入。经典的“双塔模型”通过使用两个模态间的编码器将原始数据提取为表征向量并使用对比学习损失进行语义对齐。近年来，三种以上模态的高质量对比表征越来越受到关注，并在多模态理和生成的许多应用场景中发挥着基础作用。但是现有的主流方法高度依赖于大规模、高质量的配...

2024-11-10 20:17:02 779

转载人大、蒙特利尔大学发布最新综述，全面梳理对话式搜索系统前沿进展

©PaperWeekly 原创 ·作者 |莫冯然单位 |蒙特利尔大学博士生研究方向 |对话式搜索在信息爆炸的时代，搜索引擎已成为人们日常生活中不可或缺的工具。随着人工智能（AI）和自然语言处理（NLP）技术的飞速发展，特别是大型语言模型（LLMs）的崛起，搜索引擎正不断演进，向更加智能和互动的方向迈进。近日，加拿大蒙特利尔大学与中国人民大学高瓴人工智能学院的研究团队联合发表了题为“A Su...

2024-11-10 20:17:02 38

转载直播预告 | 北京航空航天大学智能安全团队：大模型内生安全评测体系

AI安全说第8期嘉宾在线解读✔️在线实时Q&A✔️直播主题大模型内生安全评测体系直播嘉宾肖宜松北京航空航天大学博士生直播时间2024年11月9日（周六）19:30-20:0观看方式PaperWeekly视频号PaperWeekly B站直播间一键预约直播▼报告介绍01大模型内生安全评测体系近年来，人工智能算法模型取得了迅猛发展，并广泛应用于多个领域。然而，基于大数...

2024-11-08 13:06:49 27

转载博士申请 | 香港科技大学（广州）戴恩炎老师招收AI for Protein全奖博士/实习生...

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港科技大学（广州）香港科技大学是亚洲以至全球领先的研究学府之一。在 2022 年，科大位列 QS 世界大学排名第 40 位和泰晤士高等教育世界年轻大学排名第3位。作为港科大在内地筹建的独立法人办学机构，香港科技大学（广州）将不会重叠清水湾校园已提供的学科，而将重点发展交叉学科...

2024-11-08 13:06:49 42

转载 NeurlPS 2024 | 上交大、清华提出Diff-eRank，大模型评估的全新视角与方法

©PaperWeekly 原创 ·作者|魏来单位|上海交通大学MIFA实验室研究方向|大语言模型、多模态大模型自从 GPT、PaLM、Llama 等预训练大语言模型在各种自然语言处理任务上表现出优秀的性能以来，大语言模型的发展十分迅速，并已经从单模态大语言模型扩展到了多模态大模型，例如 MiniGPT-4、LLaVA 等都在各种应用场景中取得了相当惊艳的效果。如何全面、科学地评估这些...

2024-11-08 13:06:49 44

转载北京内推 | 小米AI Lab招聘大语言模型算法工程实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！小米小米集团成立于2010年4月，2018年7月9日在香港交易所主板挂牌上市(1810.HK)，是一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司。胸怀“和用户交朋友，做用户心中最酷的公司”的愿景，小米致力于持续创新，不断追求极致的产品服务体验和公司运营效率，...

2024-11-07 13:15:04 161

原创低秩近似之路（三）：矩阵乘法的CR近似

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络在《低秩近似之路（二）：SVD》中，我们证明了 SVD 可以给出任意矩阵的最优低秩近似。那里的最优近似是无约束的，也就是说 SVD 给出的结果只管误差上的最小，不在乎矩阵的具体结构，而在很多应用场景中，出于可解释性或者非线性处理等需求，我们往往希望得到具有某些特殊结构的近似分解。因此，从这篇文章开始...

2024-11-07 13:15:04 719

转载革命性突破UltrAvatar！3D虚拟可驱动人物生成，纹理引导生成打造极致完美

UltrAvatar: A Realistic Animatable 3D Avatar Diffusion Model with Authenticity Guided TexturesCVPR 2024引言在数字化时代迅速演进的今日，OPPO美国研究中心和西湖大学的研究者们带来了一项革命性的技术——UltrAvatar。这项研究不仅缩小了虚拟与现实体验之间的差距，更是在3D虚拟人像生成领域迈出...

2024-11-07 13:15:04 28

转载机器人领域高起点新刊！SmartBot第一批青年编委招募函

期刊简介SmartBot(Print ISSN:2998-4432，Online ISSN:2998-1891，季刊) 是由中华人民共和国工业和信息化部主管，哈尔滨工业大学与Wiley出版集团合作出版的开放获取英文学术期刊，由瑞士工程院(SATW) 院士、苏黎世联邦理工学院机器人与智能系统研究所所长布拉德·尼尔森(Bradley Nelson) 担任主编，中国工程院院士、哈尔滨工业大学副校长、机器...

2024-11-07 13:15:04 42

转载 NeurIPS 2024 | 浙大、微信提出精确反演采样器新范式，彻底解决扩散模型反演问题...

©作者 |王方懿康单位 |浙江大学、微信随着扩散生成模型的发展，人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前，许多应用都涉及扩散模型的反演，即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量。为彻底解决这一问题，微信视觉团队与浙江大学和清华大学联手提出了基于双向显式线性多步法的扩散模型精确反演采样器（BE...

2024-11-06 13:12:18 25

转载科研实习 | 南洋理工大学计算机系董威教授招收CSC公派/校派访问学生/远程实习生...

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南洋理工大学南洋理工大学（Nanyang Technological University）是新加坡的一所世界著名研究型大学。南大是环太平洋大学联盟、全球大学校长论坛、新工科教育国际联盟成员，全球高校人工智能学术联盟创始成员、AACSB 认证成员、国际事务专业学院协会（APSI...

2024-11-06 13:12:18 164

转载 IEEE重点会议征稿启动！第三届图像处理、计算机视觉与机器学习国际学术会议...

第三届图像处理、计算机视觉与机器学习国际学术会议(ICICML 2024)深圳大学主办 | 985高校联办 | FELLOW报告 | 连续三届IEEE出版，检索稳定！往届作者/学生/团队投稿可联系刘老师（17320119422）可享版面费优惠！读者专享福利！扫码进入快速录用投稿通道（官网在线投稿）重要信息大会时间：2024年11月22日-24日大会地点：中国深圳接受/拒稿通知：5-7个工作日截稿...

2024-11-06 13:12:18 66

原创沿着人类思路探索：达摩院提出创意链，使大模型生成人类水平的科研Idea

通过大语言模型来生成科学创意，是目前科技界的热门话题。如果大语言模型能够自动生成可行可靠的科学创意，那将极大推动人类科技的进步。但科学研究的高时效性和逻辑性要求我们不能简单地依赖大语言模型生成的创意，因为它们可能过时或逻辑不通。目前，主流的方法是通过检索增强生成（RAG）技术 [1]，检索最新的相关文献，将它们的文章信息作为外部知识拼接给大语言模型。然而，这种方法可能导致大语言模型陷入混乱，因为检...

2024-11-06 13:12:18 570

转载上海内推 | 上海人工智能实验室招聘大语言模型算法工程实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！上海人工智能实验室上海人工智能实验室是我国人工智能领域的新型科研机构，开展战略性、原创性、前瞻性的科学研究与技术攻关，突破人工智能的重要基础理论和关键核心技术，打造“突破型、引领型、平台型”一体化的大型综合性研究基地，支撑我国人工智能产业实现跨越式发展，目标建成国际一流的人工智...

2024-11-05 13:11:43 288

转载 NeurIPS 2024 | 全面重新评估！经典GNN是强有力的节点分类基线模型

©PaperWeekly 原创 ·作者 |罗元凯单位 |北京航空航天大学、香港理工大学研究方向|图神经网络本文简要介绍了经典图神经网络（GNNs）的基准分析研究，发表在 NeurIPS 2024。文章回顾了经典 GNNs 模型在节点分类任务上的表现，结果发现过去 SOTA 图学习模型报告的性能优越性可能是由于经典 GNNs 的超参数配置不佳。通过适当的超参数调整，经典 GNNs 模型在 ...

2024-11-05 13:11:43 53

转载港理工、腾讯等发布E.T. Bench，迈向细粒度、事件级的视频时序理解

论文标题：E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding收录会议：NeurIPS 2024项目主页：https://polyu-chenlab.github.io/etbench/论文链接：https://arxiv.org/abs/2409.18111代码链接：https://github.com/P...

2024-11-05 13:11:43 24

转载博后招募 | 上海交通大学医学院招募AI for science方向博士后

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！上海交通大学上海交通大学医学院是一所“985”，“211”双一流高校，综合实力稳居全国前列，在多项学科综合排名中均位列全国医学院校首位。学院坚决贯彻“人才强院”的主战略，切实加强高层次人才队伍建设，大师云集、人才荟萃。其中，中国科学院院士6人，中国工程院院士15人。学院非常重视...

2024-11-04 21:07:49 40

原创 NeurIPS 2024 | 小模型引导大模型生成，无需微调实现弱到强泛化！

©PaperWeekly 原创 ·作者 |周展辉单位 |上海人工智能实验室研究方向 |语言模型对齐大语言模型通常需要通过微调来符合人类的偏好，但直接微调这些大模型需要大量的资源，并不容易。在本研究中，我们提出“弱到强搜索”（weak-to-strong search）方法，将大模型的对齐过程转变为推理阶段的一种贪婪搜索方式：我们首先微调一个小模型，然后在大模型解码过程中，引导大模型去最大...

2024-11-04 21:07:49 463

转载 UIUC提出Self Code Align方法，实现代码生成模型的自对齐与指令调优

1. 引言在近年来的研究中，大型语言模型（LLMs）在各种编程任务中展现出了卓越的性能。这些任务包括程序合成、程序修复、代码优化、代码补全、代码翻译、软件测试等。现代LLMs通过在海量代码数据上进行预训练，使得它们在理解和生成代码片段方面具备了良好的基础能力。然而，为了充分发挥LLMs的潜力，通常需要在高质量的指令跟随数据上进行进一步的微调，这一过程被称为指令调优。指令调优的关键在于高质量数据的获...

2024-11-04 21:07:49 17

转载提高专业生产力，让你的AI画作布局可控，360 AI研究院开源新模型HiCo

©作者 | 360人工智能研究院AIGC团队AI 绘画模型一直以来被概括为“文生图”模型，究其原因，是因为当前的主流图像生成模型基本都只提供了基于文本条件生成图像的能力，各家的 AI 绘画产品也主要在生成画质和文本理解能力上进行竞争。但对于专业的使用者来说，文本能提供的画面控制能力非常有限，导致当前的 AI 绘画产品还达不到作为专业生产力工具来使用的标准。为了解决这一问题，360 人工智能研究院在...

2024-11-04 21:07:49 22

原创思考Bradley-Terry和Reward Modeling这一年

©PaperWeekly 原创 ·作者 | 孙浩单位 | 剑桥大学博士生研究方向 | 强化学习、IRLxLLM▲ version 2024.10.15论文预览版本：http://sites.google.com/view/rewardmodels上周给论文加上了一个之前没来得及写的 theorem，现在基本完成了一个自己比较满意的版本，贴出来之前还会有一些流程要走，所以先在这里先写一篇文章。如果...

2024-11-03 23:02:50 784

原创阿里通义等提出Codev-Bench：站在用户角度评估代码自动补全任务

©PaperWeekly 原创 ·作者｜潘震宇、曹荣禹单位｜阿里通义实验室、美国西北大学研究方向｜代码大模型评测近日，阿里巴巴通义实验室与美国西北大学的研究者们提出一种新的代码补全任务的评测集合——CodevBench，一个基于真实业务场景的、细粒度的、代码库级别的、以开发者为中心的评测集合，旨在为代码自动补全任务提供更精准的评估框架。论文标题：Codev-Bench: How Do LLMs ...

2024-11-03 23:02:50 1003

转载 NeurIPS 2024 | 机器人操纵世界模型来了，成功率超过谷歌RT-1 26.6%

©作者｜机器之心对于人类而言，一旦掌握了 “打开瓶盖” 的动作，面对 “拧紧螺丝” 这样的任务通常也能游刃有余，因为这两者依赖于相似的手部动作。然而，对于机器人来说，即使是这样看似简单的任务转换依然充满挑战。例如，换成另一种类型的瓶盖，机器人可能无法成功打开。这表明，目前的机器人方法尚未充分让模型学习到任务的内在执行逻辑，而只是单纯的依赖于数据拟合。针对该问题，来自中山大学和华为诺亚等单位的研究团...

2024-11-03 23:02:50 17

转载北京内推 | 美团视觉智能部招聘多模态大模型实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！美团美团视觉智能部，围绕美团丰富的生活服务场景，致力于构建世界一流的视觉核心技术能力与平台服务。当前，视觉智能部技术布局已涵盖图像视频理解、内容审核、可控生成、文字识别、人像分析与实时驱动、地图生产、自动驾驶视觉感知等多个领域，在积累了国际/国内领先技术成果的同时，兼顾方法创新...

2024-11-02 13:36:27 172

空空如也

空空如也