自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(4475)
  • 收藏
  • 关注

原创 哈工大发布最新综述:大语言模型时代的表格推理技术

©PaperWeekly 原创 ·作者 |张玄靓单位 |哈尔滨工业大学研究方向 |自然语言处理、表格推理介绍表格推理(Table Reasoning)任务要求模型根据给定表格完成用户的要求(如图 1 所示,包括表格问答、表格事实判断等)。表格推理在自然语言处理(Natural Language Processin, NLP)领域是一项重要的任务,它显著提升了人们从大量表格中获取和处理数据的...

2024-03-18 18:24:58 844

转载 北京师范大学人工智能学院诚聘海内外优秀人才

北京师范大学实验幼儿园北京师范大学实验小学北京市三帆中学(初中)北师大二附中(高中)滑动查看更多

2024-03-18 18:24:58 33

转载 总奖金4万美元!亚马逊KDD Cup 2024大模型在线购物竞赛正式启动

想拥有一个准确理解购物意图还能陪你实时交流的购物助手吗?亚马逊KDD Cup 2024大模型在线购物竞赛3月18日正式启动!奖金丰厚,诚邀各位AI人才踊跃参与!01竞赛简介KDD Cup是ACM知识发现与数据挖掘国际会议(KDD)的竞赛项目,是最具影响力和最受欢迎的数据挖掘竞赛之一。自1997年以来,每一届KDD Cup都吸引了世界各地的数据科学家、研究人员和工程师,在严格的比赛条件下,通过数据挖...

2024-03-18 18:24:58 138

转载 ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍

©作者 |机器之心编辑部来源 |机器之心Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利,但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的文本检测方法 ——Fast-DetectGPT,无需训练,直接使用开源小语言模型检测各种大语言模型...

2024-03-18 18:24:58 53

转载 CVPR 2024 | 上交大、上海AI Lab联合提出StoryGen: 开放式视觉故事生成

近年来,以扩散模型为代表的生成式 AI 模型能力日新月异,尤其是近期 OpenAI 的文本到视频的生成模型 Sora,展现出了惊人的超长上下文关注能力,实现了连贯一致的长视频生成。针对视频/图像序列生成过程中的一致性这一难题,上海交通大学与上海人工智能实验室联合团队提出了利用 AIGC 技术进行故事讲述,探索了一项新颖且极富挑战性的任务——开放式视觉故事生成(open-ended visual s...

2024-03-17 13:14:51 174

转载 真心建议大家冲一冲新兴领域,工资高前景好!

如果问你:2024年,程序员必须掌握哪项技术?AI一定是榜首!从去年起,AI大模型已是程序员的必备工具——‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍编程提效:编写更快,程序更稳定;代码更优:测试数、BUG对应减少;项目爆单:训练模型,接&做项目更快;‍输入prompt指令和搭建AI大模型开发框架,AI就能迅速批量完成工作,甚至比人工更出色。知名大厂都在布局AI市场,懂AI的程序员年薪甚至翻到80w-...

2024-03-17 13:14:51 37

原创 复旦NLP团队提出全新大模型智能体强化学习范式,大幅提升智能体推理与代码能力...

引言去年下半年,复旦 NLP 团队推出了基于大语言模型的智能体综述《The Rise and Potential of Large Language Model Based Agents: A Survey》,取得了广泛的影响力,被国内外多家知名媒体报道,据谷歌学术统计引用量已经超过 170 次。这也说明,基于大模型的智能体是大模型时代最火热的研究方向之一。研究者们通过为大模型添加感知、规划、行动...

2024-03-17 13:14:51 961

转载 博士申请 | 东方理工大学张伟课题组招收智能机器人方向博士/博后/RA/实习生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!东方理工大学宁波东方理工大学(暂名)坐落于我国东南沿海重要港口城市、历史文化名城宁波,以汇聚全球顶尖人才,孕育一所高水平、创新型、国际化的新型研究型大学为使命、短期内成为世界一流学术机构和国家重点战略学科引领者为目标、倡导平等、开放、自由的学术风气和引领变革性研究的新型非营利高...

2024-03-17 13:14:51 106

转载 两周带你玩转大模型全链路!书生·浦语大模型实战营第二期正式启动

为了帮助社区用户高效掌握和广泛应用大模型技术,我们重磅推出书生·浦语大模型实战营系列活动,旨在为开发者们提供全面而系统的大模型技术学习课程,并建立一个友好的交流平台,便于大家在大模型实践开发中分享经验、交流思想。首期实战营,我们同超过 2000 名学员一起学习了大模型微调、部署与评测全链路,相关课程视频播放量超过 4 万次。同学们不仅深入学习了理论知识,还积极地投身于实践探索中。利用开源的书生·浦...

2024-03-16 13:38:11 33

转载 后悔没有早点发现!这家公司开始春招了!

号外号外!小红书2024校园春招启动啦!专为热爱技术的你提供一个展示自我的舞台作为增速最快的互联网企业之一小红书本次春招的速度也毫不逊色最快面试后两周可拿Offer!还在犹豫什么 赶快投递简历吧~~使用PaperWeekly独家内推码Q4BPFE033Q8I助你在春招起跑线上快人一步迅速斩获小红书OFFER!独家内推使用内推码Q4BPFE033Q8I助你在校招起跑线上快人一步...

2024-03-16 13:38:11 26

原创 悉尼大学推出Calibration Study,探究多个常年存在于Calibration中的问题

©PaperWeekly 原创 · 作者 | 陶林伟,朱佑男单位 | 悉尼大学研究方向 | Calibration近年来,深度学习网络在预测准确率方面取得了显著成就。然而,在安全至关重要的领域,如医疗和自动驾驶,这些模型的 Overconfidence 却遭到了广泛质疑。这种模型的 confidence 与实际概率不一致的现象,我们称之为 “Miscalibration”。虽然不少研究工作致力于解...

2024-03-16 13:38:11 786

转载 WWW 2024 | 北邮提出GraphPAR,赋予预训练图模型可证明的公平性

©作者 |张中健单位|北京邮电大学来源 |北邮 GAMMA Lab预训练的图模型(PGMs)在图机器学习领域受到广泛关注,它们通过捕捉可转移的固有结构属性并将其应用于不同的下游任务。与预训练语言模型类似,PGMs 也会继承来自人类社会的偏见,导致在下游应用中出现歧视行为。现有公平性方法的去偏过程通常与 GNNs 的参数优化耦合。然而,现实中不同的下游任务可能与不同的敏感属性相关联,直接采用...

2024-03-16 13:38:11 49

转载 ICLR 2024 | 上海交大等提出泛化递归Transofmer,有效降低超分复杂度

©作者 |陈铮单位 |上海交通大学本研究提出了一种 Transformer 模型——RGT,旨在降低超分模型计算量。RGT 模型通过递归泛化自注意力(RG-SA),以线性复杂度捕获全局空间信息,实现低计算成本。论文题目:Recursive Generalization Transformer for Image Super-Resolution论文链接:https://arxiv.org/ab...

2024-03-15 13:16:48 110 1

原创 用傅立叶级数拟合一维概率密度函数

©PaperWeekly 原创 ·作者 |苏剑林单位 |科学空间研究方向 |NLP、神经网络在《“闭门造车”之多模态模型方案浅谈》中我们曾提到,图像生成的本质困难是没有一个连续型概率密度的万能拟合器。当然,也不能说完全没有,比如高斯混合模型(GMM)理论上就是可以拟合任意概率密度,就连 GAN 本质上也可以理解为混合了无限个高斯模型的 GMM。然而,GMM 尽管理论上的能力是足够的,但它的...

2024-03-15 13:16:48 641

转载 40万奖金!DCIC 2024•智能科技赛道火热进行,征集大模型、机器人、无人机等前沿领域方案...

数字中国创新大赛是数字中国建设峰会的重要配套活动,由国家多个部委与福建省联合主办,自2019年以来已连续举办了五届,报名参赛选手累计超10万人,奖金累计近3000万元。旨在聚智创新、示范引领,进一步激发社会各界建设数字中国的积极性、主动性、创造性,赋能经济社会高质量发展。2024数字中国创新大赛首次开设智能科技赛道,围绕智能无人系统、智能机器人、行业大模型、端侧人工智能等重点方向设置4道赛题,企业...

2024-03-15 13:16:48 25

转载 博士申请 | 美国奥本⼤学计算机系Yang Zhou老师招收ML/AI/NLP等方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!奥本⼤学奥本⼤学(Auburn University),简称“AU”,是位于阿拉巴⻢州的公⽴旗舰研究型⼤学,卡耐基分类为最⾼研究活动类⼤学"R1: Doctoral Universities – Very High Research Activity"。奥本⼤学在公⽴⼤学中排名...

2024-03-15 13:16:48 74

转载 北京/深圳/广州内推 | 腾讯基础微信&视频号团队招聘算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信基础产品团队,负责微信的通信与社交业务,为用户提供稳定高效的消息通信和社交功能;负责视频号和直播业务,为海量创作者与用户建立连接,基于超大规模的推荐架构和实时机器学习平台,为用户快速准确推荐视频和直播内容。团队在致力于为亿万用户提供稳定可靠服务的同时,秉持产品逻辑的简单...

2024-03-14 13:05:38 58

转载 大模型的DenseNet时刻!华为诺亚新作让Mamba和RetNet精度显著提升

©作者 |机器之心编辑部来源 |机器之心近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。DenseSSM 在保持训练并行性和推理效率的同时,通过密集连接实现了性能提升。该方法可广泛应用于各种 SSM 类型,如 Mamba 和 RetNet。随着 ...

2024-03-14 13:05:38 50

转载 全面解析LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention、增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据处理、新的开源模型的理解等,几乎每天都有新的发展。作为算法工程师,面对如此飞快的技术迭代,是否感觉到自己的学习步伐有点跟不上技术的发展?而且对这些新兴技术的理解仅仅停留在应用层面上,实际上对背后的原理没有具体剖...

2024-03-14 13:05:38 302

原创 我们距离GPT-4V真的很近了吗?

©PaperWeekly 原创 ·作者|李磊单位 |香港大学在 ChatGPT 引爆 AI 圈之后,很多人预言 2024 年将会是多模态的元年。的确,我们在 23 年的最后一季度见证了 GPT-4V 的发布,前不久Google 家的 Gemini 和 Anthropic 的 Claude 3 也同样支持多模态(Multimodal to Text),并且 Gemini 1.5 中能够从两小...

2024-03-13 21:50:03 337

转载 MetaGPT推出全新工作:打破数据壁垒,挑战机器学习建模流程,数据科学家或将被取代?...

研究背景目前,由大型语言模型(LLM)驱动的智能体已经证明了它们在处理复杂任务方面的显著潜力。此外,通过赋予 LLM 代码执行能力来提升其问题解决能力正逐渐成为一种趋势,这一点已经通过 Code-Interpreter [1]、Open Interpreter [2]、TaskWeaver [3] 等工作得到了实践验证。然而,在数据科学领域,面对数据的实时变化、任务间依赖关系复杂、流程优化的专业性...

2024-03-13 21:50:03 99

转载 北京/苏州内推 | 微软亚洲互联网工程院招聘NLP/LLM方向算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲互联网工程院微软STCA · Search & Distribution Group,致力于自然语言处理(NLP)和AI核心技术的深入研究、成果在全球产品中的落地应用,由北京、苏州两地的400多位热爱技术、勤于实践、勇于梦想的科学家和工程师构成。团队在信息检索、...

2024-03-13 21:50:03 26

转载 橘猫减去「猫」会变成什么?清华联合阿里推出概念半透膜模型

©作者 |机器之心编辑部来源 |机器之心一只橘猫,减去「猫」,它会变成什么?第一步在常见 AI 作图模型输入「一只胖胖的像面包的橘猫」,画出一只长得很像面包的猫猫,然后用概念半透膜 SPM 技术,将猫猫这个概念擦掉,结果它就失去梦想变成了一只面包。上图 1 是更多的猫猫图失去猫这个概念后的结果。▲图1. 概念半透膜 SPM 针对不同的「猫」图擦除猫概念后的效果下图 2 到图 6 展示了更多的...

2024-03-13 21:50:03 47

原创 智慧城市大模型来啦!港大联合百度推出UrbanGPT

项目链接:https://urban-gpt.github.io/代码链接:https://github.com/HKUDS/UrbanGPT论文链接:https://arxiv.org/abs/2403.00813研究实验室链接:https://sites.google.com/view/chaoh/home视频展示:今天我给大家介绍一个最近来自于港大黄超老师数据智能实验室最新研发的智慧城市大模...

2024-03-12 20:02:43 761

转载 北京内推 | 度小满金融数字人团队招聘2D/3D数字人方向研究型实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!度小满金融DXM AI-LAB致力于构建度小满金融智能引擎的核心技术,从前沿研究到实际应用,我们深耕于计算机视觉、自然语言处理、AIGC、图模型、数字人技术、机器学习以及因果推断等关键技术领域。我们已在CVPR、ECCV、ACMMM、ACL、EMNLP等国际顶级学术会议上发表文...

2024-03-12 20:02:43 66

原创 ​将所有有用的信息整合到一张图片中:大型多模态模型能够进行图片内的学习...

论文题目:All in a Single Image: Large Multimodal Models are In-Image Learners论文链接:https://arxiv.org/abs/2402.17971开源链接:https://github.com/AGI-Edgerunners/In-Image Learning动机和背景近年来,大语言模型取得了显著的成功。尽管 GPT-4V ...

2024-03-12 20:02:43 839

转载 博士申请 | 新加坡管理大学周攀老师招收机器学习/CV等方向全奖博士/访问学生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡管理大学新加坡管理大学(Singapore Management University,SMU)成立于2000年,坐落于新加坡市中心,为世界顶级的财经类院校和计算机信息技术强校。目前,新加坡管理大学总共有学生一万余人,包含六个学院:计算机与信息系统学院、会计学院、经济学院...

2024-03-12 20:02:43 56

转载 文末送书 | 大模型的智慧之源:图数据库理论与实践

自2023年以来,大语言模型(Large Language Models,LLMs)的兴起已经改变了科技行业的面貌。科创公司如果不涉足这一领域,似乎就不好意思称自己是科技企业。然而,随着大语言模型的普及,它固有的缺陷也不断地暴露出来。例如,GPT-4在“自我纠正”方面的成功率仅为 1% ,这一现象引发了公众对大模型推理能力的质疑。简单来说,在大模型在处理推理任务时存在局限性,如果模型不知道正确答案...

2024-03-11 18:43:52 49 3

原创 对比近期发布的几个小模型,sLLM的天花板在哪里?

©PaperWeekly 原创 ·作者 |胡翔单位 |中国人寿研发中心研究方向 |对话系统、LLM2024 是大模型落地应用的关键年,接下来会看到更多从硬件、架构、算法等方面极限挖掘大模型效率的探索。众人拾柴火焰高,相信在大家共同的开源努力下,我们可以更快奔向 AGI 的目标。——摘自刘知远老师最近对 Google 发布 Gemma 后发的一条朋友圈写在前面:Google 最近也劲爆放出...

2024-03-11 18:43:52 371

转载 北京内推 | 华为诺亚方舟实验室招聘自动驾驶预测/规控实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!华为诺亚方舟实验室华为诺亚方舟实验室(Noah's Ark Lab)是华为的 AI 能力研究中心,立足于人工智能基础算法研究,聚焦打造数据高效和能耗高效的 AI 引擎。实验室广泛分布于世界各地,在香港、深圳、北京、上海、西安、伦敦、巴黎、多伦多、蒙特利尔、埃德蒙顿等均设有研发分...

2024-03-11 18:43:52 152

转载 田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

©作者 |陈萍、大盘鸡来源 |机器之心只用 24G 显存,消费级 GPU 就能搞定大模型了。上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10 亿以下参数小模型,主打在移动设备上运行 LLM。...

2024-03-11 18:43:52 104

原创 Attention不是唯一的选择:基于反事实推理的可解释性推荐

©PaperWeekly 原创 ·作者 |李逸聪单位|悉尼科技大学研究方向|推荐系统论文题目:Attention Is Not the Only Choice: Counterfactual Reasoning for Path-Based Explainable Recommendation论文链接:https://arxiv.org/pdf/2401.05744近日,悉尼科技大学徐...

2024-03-10 20:49:23 812

转载 科研实习 | 南方科技大学大数据创新中心招聘多模态大模型/Infra方向研究型实习生...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的教育培养和研究基地为目的。本系志在为国家培养出具有扎实的科学基础,思想活跃,创新意识和能力强,有国际视野,脚踏实地,有朝气、有理想的拔尖人才。本系已经建立起本硕博人才培养体系,拥有统计学和数据科学与大...

2024-03-10 20:49:23 122

转载 最新RAG综述来了!北京大学发布AIGC的检索增强技术综述

©作者 |赵鹏昊单位 |北京大学硕士生研究方向 |分布式机器学习近期,RAG(Retrieval-Augmented Generation)在 AI 领域引起了广泛关注,成为了众多研究者和开发者热议的焦点。作为一种将检索与生成相结合的技术,RAG 展示了在各种任务中,如问答、对话生成和文本摘要等,取得卓越成果的潜力。它的出现为解决复杂问题提供了新的视角,使得人工智能在理解和回应用户需求方面更...

2024-03-10 20:49:23 433

转载 ICLR 2024 | UIUC等提出BioBridge:用知识图谱构建多模态生物医学基础模型

©作者 |Zifeng Wang单位 |UIUC引言这是 UIUC Zifeng Wang 等发表在 ICLR'24 上的论文。论文题目:BioBridge: Bridging Biomedical Foundation Models via Knowledge Graphs论文链接:https://arxiv.org/pdf/2310.03320.pdf在生物医学研究领域,一直以来,基础模型...

2024-03-10 20:49:23 47

转载 北京/杭州内推 | 阿里通义实验室招聘大模型算法专家/研究型实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里通义实验室阿里巴巴通义实验室,主要负责通义系列大模型研究与产品落地。其中对话智能团队,以大模型研究和应用为中心,以对话为核心交互形态,推进大模型的大规模商业化应用,主要技术包括:(1)对话、问答、Code、摘要、plugin、planning、人类对齐、高效训练等(2)AI...

2024-03-08 13:31:12 135

原创 WWW 2024 | 简单却强大:揭秘Transformer在动态图建模中的魔法

©PaperWeekly 原创 ·作者 |吴玉霞单位 |新加坡管理大学博士后研究方向 |图数据挖掘论文题目:On the Feasibility of Simple Transformer for Dynamic Graph Modeling论文链接:https://arxiv.org/pdf/2401.14009.pdf代码链接:https://github.com/YuxiaWu/Si...

2024-03-08 13:31:12 566

转载 ICLR 2024 | 单卡训练仅需1天!川大、北邮等提出多模态噪声关联学习

©作者 |林义杰单位 |四川大学研究方向 |多模态学习在 2024 世界经济论坛的一次会谈中,图灵奖得主 Yann LeCun 提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间 [1]。借助文本信息的多模态视频表征学习可抽取利于视频理解或内容生成的特征,正是促进该过程的关键技术。然而,当下视频与文本描述间广泛存在的噪声关联现象严重阻碍了视频表征学习。因此本文中,...

2024-03-08 13:31:12 63

原创 简单却有效的Agent推理框架:通过预测未来大幅提升智能体的规划能力

©PaperWeekly 原创 · 作者 |黄健钊、傅大源单位 |北京邮电大学硕士生研究方向 |自然语言处理论文标题:PreAct: Predicting Future in ReAct Enhances Agent’s Planning Ability论文链接:https://arxiv.org/abs/2402.11534代码链接:https://github.com/Fu-Dayuan...

2024-03-07 17:45:18 1075

转载 揭秘爆火Sora背后的技术,一文综述扩散模型的最新发展方向

©作者 |机器之心编辑部来源 |机器之心为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此,扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成:前向过程和反向过程。前向...

2024-03-07 17:45:18 47

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除