自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(4478)
  • 收藏
  • 关注

转载 上海内推 | 途深智合招聘AI4Science方向研发工程师/算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!途深智合公司成立于2022年,是一家人工智能蛋白质设计领域的新锐公司,致力于开发轻量、可控的人工智能模型,降低生物科技领域中开发新合成生物产品的难度、周期和成本。公司CEO是上海交通大学自然科学研究院的王宇光副教授,团队核心成员来自于上海交大,清华大学,约翰霍普金斯大学等。公司...

2023-12-29 12:38:06 316

原创 用伪语言标签对CLIP进行自步课程自适应,实现到定位任务的无监督迁移

论文题目:CLIP-VG: Self-paced Curriculum Adapting of CLIP for Visual Grounding发表期刊:IEEE Transactions on Multimedia 中科院/JCR一区顶刊工作内容:基于自步课程学习实现多模态大模型 CLIP 在多模态视觉语言理解与定位任务上的迁移研究论文链接:https://ieeexplore.ieee.or...

2023-12-28 14:03:37 801

转载 博士申请 | 香港科技大学(广州)谢思泓教授招收机器学习全奖博士/博后/RA

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)2022年6月29日,国家教育部宣布依法批准正式设立香港科技大学(广州)。香港科技大学(广州)融合内地与香港优质教育资源,探索前沿交叉学科建设,创新人才培养模式,对于培养具有国际视野的创新型人才,推动国家高等教育综合改革,促进内地与香港教育融合发展,服务粤港...

2023-12-28 14:03:37 443

转载 KDD 2023 | MetricPrompt: 基于度量的提示学习少标注文本分类方法

©作者 | 董泓源,张伟男等单位 | 哈尔滨工业大学来源 | 社媒派SMP论文介绍尽管在越来越多地应用于各类少标注自然语言处理任务中,提示学习方法中模板和标签映射的设计十分困难,需要对模型、分类任务的深入理解和大量试错。现有的标签映射自动化设计方法尽管省去了人力,但是却难以将下游少标注文本分类任务和预训练任务统一起来,导致其性能仍不尽如人意。针对这一问题,本文提出 MetricPrompt,通过将...

2023-12-28 14:03:37 166

转载 顶配版SAM!由分割一切迈向感知一切

在计算机视觉领域,分割被视为感知的基础要素。通过分割,系统得以准确地定位和区分图像中的各个对象,为更深层次的感知提供了必要基础。全面的视觉感知不仅包括对图像进行分割,更涵盖对图像中对象与场景的语义理解、关系推断等高层次认知。现有的视觉分割基础模型,如 SAM 及其变体,集中优势在形状、边缘等初级定位感知,或依赖外部模型完成更高级的语义理解任务。然而,迈向更高效的视觉感知则需要在单个模型中实现全面的...

2023-12-28 14:03:37 84

转载 Patterns开设新文章类型丨让数据成为艺术特刊征稿进行中!

交叉学科InterdisciplinaryPatterns是Cell Press细胞出版社旗下数据科学领域的开放获取期刊,致力于推动数据科学及其在实践、政策和管理中的应用,涉及多研究领域,包括计算机、自然、社会科学和人文科学。创刊于2020年4月,Patterns集百家之长,为跨多个研究领域的数据相关问题提供了解决方案。本刊发表多种类型的文章,例如,意见、观点文章和综述并且也发表descripto...

2023-12-27 12:31:15 37

转载 北京内推 | 右脑科技RightBrain AI招聘AIGC算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京右脑科技右脑科技RightBrain AI,国内领先的AIGC技术型公司,创始团队来自北京大学,是NUWA女娲、智源悟道等多模态预训练大模型的核心成员。公司在算法研发、产品落地、融资等方面进展迅速,一年内已经连续获得一线基金3轮投资,期待你的加入。AIGC算法实习生坐标:北...

2023-12-27 12:31:15 295

原创 补齐大模型注意力短板,7B模型工具使用比肩GPT-4!

论文标题:Fortify the Shortest Stave in Attention: Enhancing Context Awareness of Large Language Models for Effective Tool Use巩固注意力的短板:通过增强上下文感知提高大型语言模型在工具使用方面的表现论文作者:陈雨涵,吕昂,林廷恩,陈畅与,武玉川,黄非,李永斌,严睿作者单位:中国人民大...

2023-12-27 12:31:15 927

转载 InstructProtein: 基于知识指令的人类语言-蛋白质语言对齐模型

近年来,大语言模型的出现革新了自然语言处理领域。ChatGPT,Claude-2 等模型已经深入到人们的日常生活中了如语言翻译、信息获取、代码生成。但这些语言模型在自然语言和代码语言上极强的处理能力并不能迁移到生物序列(如蛋白质序列)上。当让其描述一条蛋白质序列的功能或者生成一条符合某种性质的蛋白质,它们常常不会遵从指令,或者给出错误答案。文章认为这一现象的出现是因为当前蛋白质-文本对数据集存在两...

2023-12-27 12:31:15 92

原创 ​NeurIPS 2023 | SGFormer: 仅使用一层全局注意力的简化图Transformer

设计针对图结构数据的 Transformer 模型(通常简称 graph Transformer)目前已成为了一个备受关注的研究方向。有别于传统图神经网络(简称 GNN)每层更新只能聚合邻居节点的信息,Transformer 通过全局注意力机制在每层更新中可以聚合图中所有其他节点的信息。这种设计可以有效避免 GNN 的过度挤压问题、改善对异质图的建模、缓解噪声/残缺/冗余连边对性能的影响 [1]。...

2023-12-26 12:14:46 758 1

转载 博士申请 | 香港科技大学(广州)张延林老师招收AI4Science方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)2022年6月29日,国家教育部宣布依法批准正式设立香港科技大学(广州)。香港科技大学(广州)融合内地与香港优质教育资源,探索前沿交叉学科建设,创新人才培养模式,对于培养具有国际视野的创新型人才,推动国家高等教育综合改革,促进内地与香港教育融合发展,服务粤港...

2023-12-26 12:14:46 375

转载 清华提出全新代理注意力范式:Softmax注意力与线性注意力的优雅融合

©作者 |韩东辰单位 |清华大学来源 |机器之心来自清华大学的研究者提出了一种新的注意力范式——代理注意力 (Agent Attention)。近年来,视觉 Transformer 模型得到了极大的发展,相关工作在分类、分割、检测等视觉任务上都取得了很好的效果。然而,将 Transformer 模型应用于视觉领域并不是一件简单的事情。与自然语言不同,视觉图片中的特征数量更多。由于 Softm...

2023-12-26 12:14:46 197

转载 LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

引言▲图1.LMDrive 框架功能概览图说明:LMDrive 接收语言指令和多模态多视角的传感器数据作为输入,并实时输出决策控制信号,以应对各种各样复杂的驾驶场景。大语言模型(Large Language Model,LLM)可谓是 2023 年最火热也最重要的人工智能子领域,在各类机器学习任务中都展现出了惊艳的效果,相关的上下游应用也都发展得十分迅速。而将大语言模型应用在自动驾驶领域也有一...

2023-12-26 12:14:46 252

转载 大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer

©作者 |腾讯&港中文团队来源 |量子位在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越SOTA。论文题目:UniRepLKNet: A U...

2023-12-25 12:47:07 100

原创 EMNLP 2023 | 上下文学习是否能够编辑事实知识?

©PaperWeekly 原创 ·作者 |werge单位 |中科院软件所研究方向 |自然语言处理论文标题:Can We Edit Factual Knowledge by In-Context Learning?论文链接:https://aclanthology.org/2023.emnlp-main.296.pdf代码链接:https://github.com/Zce1112zslx/I...

2023-12-25 12:47:07 952

转载 轻松跟踪每日全球AI焦点,这个工具,让你的阅读论文效率飞跃一个level

每天,AI领域有超过300篇崭新的论文发表,而这个数字还以每年超20%的速度在持续增长。假设看完一篇论文需要花费3分钟,通读所有论文将需要花费15个小时,即使最勤奋的研究者,废寝忘食也看不完这么多论文。智源社区今天推出“热点论文”功能,利用这一工具,你可以在半小时内找到最新研究的热点,帮助你把阅读论文的效率加速一个数量级。目前新工具有以下5个特色:全网热度榜单这是一张每日更新的热点论文地图,它筛选...

2023-12-25 12:47:07 60

转载 北京内推 | Apple中国NLP团队招聘NLP/LLM方向算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!AppleApple is a place where extraordinary people gather to do their best work. Our community is made up of every kind of individual: artist...

2023-12-25 12:47:07 341

原创 ​大型视觉语言模型中对象幻觉的缓解:视觉对比解码(VCD)​

阿里巴巴达摩院和新加坡南洋理工大学的研究团队提出了一种创新方法——视觉对比解码(VCD),有效解决大型视觉语言模型中的对象幻觉问题,同时为提升模型在复杂视觉任务中的性能开辟新路径。在自然语言处理和计算机视觉领域,大型视觉语言模型(LVLMs)已经取得了显著成就,尤其是在图像和文本信息的交互处理方面。然而,尽管它们的高效能和多功能性,LVLMs 仍面临一个主要的挑战:对象幻觉。这个问题表现为模型生成...

2023-12-24 13:35:25 513

转载 大模型人才今年的薪资。。。

“大模型狂热”从未停止谷歌最强AI模型Gemini问世,登上AI天花板国内巨头战队华为、百度、阿里在AIGC的厮杀中从通用大模型渗透到各垂类应用市场就连中国创投资本也独宠AIGC企业百度、科大讯飞市值分别增加27亿和45亿美元这导致AI人才缺口大、价格贵硕士毕业年薪可达70万元甚至还有百万年薪挖掘大模型人才!!作为程序员,如何抢占先机,享受AI技术带来的红利?!????知乎知学堂邀你加入:行业前沿资源...

2023-12-24 13:35:25 73

转载 北京内推 | 秘塔科技招聘NLP算法工程师(社招/校招)

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!秘塔科技秘塔科技成立于2018年4月,是人工智能领域的一家新锐科技公司,致力于运用AI技术赋能专业场景,将重复脑力劳动AI化,以AI为杠杆撬动专业场景的百倍生产力提升。在智能法律翻译、AIGC、文档辅助创作等方向上进行技术研发与产品落地。在团队方面,秘塔科技创始团队背景覆盖计...

2023-12-24 13:35:25 216

转载 NeurIPS 2023 | 腾讯AI Lab绝悟新突破:在星际2灵活策略应对职业选手

©作者 |机器之心编辑部来源 |机器之心近日,腾讯 AI Lab 的游戏 AI 团队宣布了其决策智能 AI "绝悟" 在《星际争霸 2》中的最新研究进展,提出一种创新的训练方法显著提升了 AI 的局内策略应变能力,使其在考虑了 APM 公平的对战环境中,与 3 位国内顶尖的神族职业选手各进行多达 20 局神族 vs 神族的对战,稳定地保持 50% 及以上的胜率。该成果已获 NeurIPS 20...

2023-12-24 13:35:25 159

转载 再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

©作者 |克雷西来源 |量子位用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登Nature。作者之一、谷歌DeepMind研究副总裁Pushmeet Kohli表示:训练数据中不会有这个方案,它之前甚至根本不为人类所知。论文链接:https://www.nature.com/articles/s41586-023-06924-6这项技术名为FunSearch,其中的Fun...

2023-12-23 20:55:31 47

转载 AAAI 2024 | 测试时领域适应的鲁棒性得以保证,TRIBE在多真实场景下达到SOTA

©作者 |机器之心编辑部来源 |机器之心测试时领域适应(Test-Time Adaptation)的目的是使源域模型适应推理阶段的测试数据,在适应未知的图像损坏领域取得了出色的效果。然而,当前许多方法都缺乏对真实世界场景中测试数据流的考虑,例如:测试数据流应当是时变分布(而非传统领域适应中的固定分布)测试数据流可能存在局部类别相关性(而非完全独立同分布采样)测试数据流在较长时间里仍表现全局类别...

2023-12-23 20:55:31 101

原创 注意力机制真的可以“集中注意力”吗?

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 月之暗面研究方向 | NLP、神经网络之前在《Transformer升级之路:从Performer到线性Attention》、《为什么现在的LLM都是Decoder-only的架构?》等文章中,我们从 Attention 矩阵的“秩”的角度探讨了 Attention 机制,并曾经判断线性 Attention 不如标准 Attention...

2023-12-23 20:55:31 1016

转载 AAAI 2024 | 低光增强与曝光纠正的新方向:不良光照场景下的新视角合成

大家好,今天要介绍的是 AAAI 2024 关于不良光照下 NeRF 新视角合成的工作 Aleth-NeRF (Aleth-NeRF: Illumination Adaptive NeRF with Concealing Field Assumption),目的在不良光照场景下(如低光照和过曝光)场景,能够从 NeRF 无监督增强并且生成正常光照的连贯 3D scene。我们提出的方法可以对现有 ...

2023-12-22 12:06:42 84

原创 港中文128页全球首份Gemini vs GPT-4V多模态PK报告

2023 年 12 月 6 日,谷歌发布了最新一代的通用人工智能大模型 Gemini,并报告在多项测试中取得了最先进的结果,甚至在 MMLU 测试中首次取得了超过人类专家的成绩,人工智能似乎进入 Gemini 时代。直到北京时间上周三晚谷歌才正式开放 Gemini Pro 版本的 API,使得用户可以亲自体验。Gemini 的实际多模态能力究竟如何呢?是否真如他们技术报告和宣传视频中展示的那样?...

2023-12-22 12:06:42 952

转载 文末送书 | 机器学习统计分析:以统计思维推动模型实现(含Python实现)

董平 著清华大学出版社2023-09-019787302634010定价: 99.00 元新书推荐????今日福利|关于本书|机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用方差对不确定性的捕捉构造 k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回...

2023-12-22 12:06:42 368 3

转载 北京内推 | AMD北京AI算法团队招聘大语言模型算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!AMDAMD 是高性能与自适应计算领域的领先企业,致力于提供优质的产品和服务,助力客户解决各种重大的挑战。我们的技术推动着数据中心、嵌入式系统、游戏和 PC 市场迈向未来。AMD 于 1969 年在硅谷创立,最初只有几十名员工,从那时起 AMD 便踏上创新之路,致力于引领半导体...

2023-12-22 12:06:42 277

原创 堪比Midjourney!上百种风格AI写真丝滑生成,这个开源项目能颠覆照相馆吗?

概览简介FaceChain 是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版,可以生成超乎想象空间的个人写真作品。更有意思的是,FaceChain 还集成了说话人与虚拟试衣的功能,让你的数字替身更加生动真实,拓展出了更多的商业价值与落地场景。FaceChain 自 8 月份首次开源 v1 版本以来,主要...

2023-12-21 12:20:16 1096

转载 北京内推 | 微软亚洲互联网工程院招聘Excel Copilot算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲互联网工程院微软(亚洲)互联网工程院是微软全球产品研发的一支重要中坚力量,整合了原微软亚洲搜索技术中心和广告技术中心,现拥有位于中国北京、苏州、台北、东京的近 2000 名研发人员,并在北京、苏州建有世界一流的地区性研发中心,研发涉及人工智能、机器学习、神经网络、自然语...

2023-12-21 12:20:16 284

转载 2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍

©作者 |上交大IPADS实验室来源 |量子位原本需要一张 16 万元的 80G A100 干的活,现在只需要一张不到 2 万元的 24G 4090 就够了!上海交大 IPADS 实验室推出的开源推理框架 PowerInfer,让大模型推理速度加快了 11 倍。而且不用量化,就用 FP16 精度,也能让 40B 模型在个人电脑上运行;如果加入量化,2080 Ti 也能流畅运行 70B 模型。...

2023-12-21 12:20:16 138

原创 以变分推断为视角:基于变分EM算法框架推导扩散模型

©PaperWeekly 原创 ·作者 |石壮威单位|季华实验室研究方向|AI for Science引言扩散模型是当前深度学习领域最引人瞩目的算法之一,它不仅在一系列生成任务中取得优秀表现,推动了生成式人工智能的高歌猛进;更具有严密的理论基础,在探索深度学习可解释性的道路上迈出了坚实的一步。扩散模型与此前的基于变分推断的生成式模型(例如变分自编码器和标准化流)一脉相承,而又具有独到之...

2023-12-21 12:20:16 435

原创 AAAI 2024 | HGPrompt: 统一同质图和异质图的少样本图提示学习

©PaperWeekly 原创 ·作者 |于星橦单位 |中国科学技术大学博士生研究方向 |图神经网络论文题目:HGPROMPT: Bridging Homogeneous and Heterogeneous Graphs for Few-shot Prompt Learning论文链接:https://arxiv.org/pdf/2312.01878.pdf代码链接:https://git...

2023-12-20 13:19:27 1093

转载 科研实习 | 新加坡国立大学尤洋老师课题组招收Data-centric AI/LLM科研实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of Singapore)简称国大(NUS),是亚洲顶尖国际知名学府。截至2023年,新加坡国立大学在QS世界大学排名为世界第8名(亚洲第一)、泰晤士高等教育世界大学排名为世界第19名、世界大学学术排名为世界...

2023-12-20 13:19:27 551

原创 个性有了,心眼坏了?大模型微调的潜在危害

©PaperWeekly 原创 · 作者 | 陈思硕单位 |北京大学研究方向 |自然语言处理导言:大模型个性化与安全的两难大模型的能力虽强,现实中我们在特定下游领域部署大模型时,一般也需要在对应的业务数据上进行个性化微调,Llama2 权重的开源和 OpenAI GPT 微调 API 的发布更是方便了开发者在自己的业务问题上调教大模型。理想中,在业务数据上个性化调教过的大模型应该是这样的, 既...

2023-12-20 13:19:27 952

转载 清华等团队研究登Nature子刊封面:用生物脑机制启发持续学习,让智能系统适者生存...

©作者 |机器之心编辑部来源 |机器之心在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一,也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因而无法适应动态开放环境的挑战。针对该问题,持续学习模拟生物智能的学习过程和学习能力,发展新型的机器学习理论和方法,通过持续...

2023-12-20 13:19:27 121

原创 让炼丹更科学一些:SGD的平均收敛趋势

©PaperWeekly 原创 ·作者 |苏剑林单位 |月之暗面研究方向 |NLP、神经网络很多时候我们将深度学习模型的训练过程戏称为“炼丹”,因为整个过程跟古代的炼丹术一样,看上去有一定的科学依据,但整体却给人一种“玄之又玄”的感觉。尽管本站之前也关注过一些优化器相关的工作,甚至也写过《从动力学角度看优化算法》系列,但都是比较表面的介绍,并没有涉及到更深入的理论。为了让以后的炼丹更科学一...

2023-12-19 13:10:27 916

转载 NeurIPS 2023 | 有效提高视频编辑一致性:基于文生图模型新方法EI²

©作者 |机器之心编辑部来源 |机器之心美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。该论文从理论角度分析和论证视频编辑过程中出现的不一致的问题,主要由引入的时序信息学习模块使特征空间出现协变量偏移造成,并针对性地设计了新的网络模块进行解决以生成高质量的编辑结果。目前,该论文已被机器学习顶会...

2023-12-19 13:10:27 52

转载 OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!...

©作者 |孔令宇单位 |国科大博士生研究方向 |多模态学习想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤——这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果:无论是中英文的大段文字:还是包含了公式的文档图片:又或是手机页面截图:甚至可以将图片中的表格转换成 Latex 格式:当然,作为多模大模型,通...

2023-12-19 13:10:27 1157

转载 顶刊TPAMI 2023 | Temporal Perceiver:通用时序边界检测方法

©作者 |王利民单位 |南京大学本文介绍一下今年我们组被 T-PAMI 2023 收录的时序边界检测工作 Temporal Perceiver: A General Architecture for Arbitrary Boundary Detection。论文题目:Temporal Perceiver: A General Architecture for Arbitrary Boundar...

2023-12-18 13:07:24 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除