自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(3012)
  • 收藏
  • 关注

转载 博士申请 | 上海交通大学叶南阳老师招收计算机视觉/机器学习方向博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海交通大学上海交通大学约翰·霍普克罗夫特计算机科学中心于 2017 年 1 月正式成立,以图灵奖得主、中科院外籍院士、上海交通大学访问讲席教授 John Hopcroft 的名字命名,由他亲自担任主任。中心的使命在于创建宽松自由的国际化学术环境,招募深具潜力的青年学者,助力他...

2023-01-29 13:18:30 30

转载 NeurIPS 2022 | C-mixup:扩展mixup提高回归任务的模型泛化性

©作者 | spectator单位 |核桃量化研究方向 |量化投资本文简要深度学习从业者通常面临过度拟合的挑战,为了改进泛化,先前的工作已经提出了许多技术,包括数据扩增和显式正则化。其中最典型的工作是 mixup,其通过对随机采样的样本对的特征进行线性插值并对相应的标签应用相同的插值来完成数据增广,达到隐式地正则化效果。虽然 mixup 在提高分类问题的泛化能力方面表现出了良好的效果,但在连续...

2023-01-28 21:12:01 21

原创 Transformer升级之路:长度外推性与局部注意力

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络对于 Transformer 模型来说,其长度的外推性是我们一直在追求的良好性质,它是指我们在短序列上训练的模型,能否不用微调地用到长序列上并依然保持不错的效果。之所以追求长度外推性,一方面是理论的完备性,觉得这是一个理想模型应当具备的性质,另一方面也是训练的实用性,允许我们以较低成本(在较短序列上...

2023-01-28 21:12:01 17

转载 萌兔送福!PaperWeekly专属红包封面来啦~

SPRINGFESTIVAL红红火火 恍恍惚惚期待了一整年的春节终于要来了!小时候过春节最开心的事就是收压岁钱长大了以后我变成了发压岁钱的那个人于是最开心的事变成了……收集各种红包封面感谢大家一年来的陪伴和爱兔年春节PaperWeekly也为大家准备了专属红包封面!兔年限定的红包封面来自我们的设计师亲笔手绘红红火火喜喜庆庆可爱小兔子挥笔送祝福祝PaperWeekly的读者朋友们兔年行大运论文多...

2023-01-20 18:44:38 165

原创 还在想办法提升人脸防伪泛化吗?仅靠人脸系统现有知识即可让性能大幅提升...

©PaperWeekly 原创 ·作者 |张文天单位 | 深圳大学计算机视觉所研究方向|人脸防伪在人脸识别系统中,通常会在人脸识别模块之前设置一个独立的人脸防伪模块,用于保障系统安全性。由于真实场景中的人脸伪造攻击的方式多种多样,无法全面收集,这种高度依赖于有限训练集的学习型方法很难对所有攻击方式进行预测,不能有效地推广到未知的攻击中。与人脸防伪任务不同,其他人脸相关任务(例如人脸识别和属...

2023-01-19 19:08:35 608

转载 NeurIPS 2022 | 基于结构聚类的异质图自监督学习

来源 | 北邮 GAMMA Lab论文作者:杨亚明,管子玉,王哲,赵伟,徐偲,陆维港,黄健斌论文单位:西安电子科技大学,计算机科学与技术学院引言现阶段,图(Graph)上的自监督学习大多都遵循图对比学习框架,这些方法通常需要先构造一系列的正样本对以及负样本对,然后通过在低维表示空间中拉近正样本并且推远负样本来学习节点/图的表示。目前,研究者们已经探索了节点丢弃、连边扰动等各种生成正样本的策略,以及...

2023-01-19 19:08:35 159

原创 CVPR 2022 | ELP:简单间断线性探针即可提升各种分类性能

©PaperWeekly 原创 ·作者 | 梁远智单位 | 悉尼科技大学博士生研究方向 |多模态与表示学习自序分类是 CV 经典任务。在之前的工作中(MHEM TNNLS2022),针对 FGVC,我们曾经尝试跳出修改结构(FGVC 中主要是各种 part based model)和引入数据等固有思路,尝试通过更加更加简单有效的方式提升性能。我们惊讶地发现,简单的适当的困难样本挖掘足以明显的提...

2023-01-18 14:15:23 306

转载 北京内推 | 微软亚洲互联网工程院(STCA)招聘科研实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲互联网工程院微软 STCA MSPH Intelligence TEAM 由多位人工智能领域的科学家和工程师组成,团队成员均为北大硕博,且具有微软亚洲研究院、北大计算语言所、百度 IDL 研究院等机构的丰富科研经验,致力于 DL/ML 基础技术的研究与应用。团队与微软亚...

2023-01-18 14:15:23 58

转载 北京内推 | 微软亚洲研究院DKI组招聘大模型方向研究实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院Cloud Intelligence组是微软亚洲研究院DKI (Data, Knowledge & Intelligence) Area下专注于智能化云计算的研究团队,主要研究方向包括AI for System, AI for Customer 和AI f...

2023-01-17 22:15:31 142

转载 AAAI 2023 | 基于T5的两阶段的多任务Text-to-SQL预训练模型MIGA

©作者 |网易互娱AI Lab来源|机器之心网易互娱 AI Lab 联合广东外语外贸大学和哥伦比亚大学基于预训练语言模型 T5 的预训练方式,提出了两阶段的多任务预训练模型 MIGA。越来越多的工作证明了预训练语言模型(PLM)中蕴含着丰富的知识,针对不同的任务,用合适的训练方式来撬动 PLM,能更好地提升模型的能力。在 Text-to-SQL 任务中,目前主流的生成器是基于语法树的,需要针...

2023-01-17 22:15:31 32

原创 通用视觉预训练大模型巡礼系列(一):UFO大模型

©PaperWeekly 原创 ·作者 |张燚钧单位 |中国移动云能力中心研究方向 |预训练大模型近来,以 ChatGPT 为代表的自然语言对话大模型,以及以 Stable Diffusion 为代表的多模态文图生成大模型展现出惊艳的效果。而面向视觉领域的通用视觉模型相对来说似乎略显冷清。事实上,从 2021 年商汤联合上海人工智能实验室发布“书生”通用视觉体系以及在 2022 年世界人工...

2023-01-17 22:15:31 92

原创 NeurIPS 2022 | 基于稀疏学习的提升模型泛化能力算法

©PaperWeekly 原创 ·作者 |GlobalTrack深度学习模型经常遇到较弱的泛化能力等问题。由于损失函数景观(loss landscape)一般是复杂的且非凸,该特性使模型常常收敛到尖锐最小点(Sharp Minima)。一般认为最小值点附近越平滑,模型泛化能力越强。Sharpness-Aware Minimization(SAM)方法是一种可以提升模型泛化能力的算法,可以同时...

2023-01-13 21:20:30 253

转载 AAAI 2023 | 基于多模态标签聚合的视频检索模型TABLE,多项SOTA

©作者 |QQ浏览器搜索技术中心、腾讯PCG ARC Lab来源|机器之心近年来,互联网短小视频内容的爆发式增长,对视频 - 文本检索(Video-Text Retrieval)的能力提出了更高的要求。在 QQ 浏览器搜索中,视频通常包含标题、封面图、视频帧、音频等多种模态信息,因此视频检索模型引入了多模态特征,以刻画 query 与视频在多个模态上的相关程度,并进行综合排序,提升视频搜索结...

2023-01-13 21:20:30 62

转载 Meta发布ConvNeXt V2!仅用最简单的卷积架构,性能不输Transformer

©作者 |机器之心编辑部来源|机器之心ConvNeXt 模型更新了!经过几十年的基础研究,视觉识别领域已经迎来了大规模视觉表征学习的新时代。预训练的大规模视觉模型已经成为特征学习(feature learning)和视觉应用的基本工具。视觉表征学习系统的性能在很大程度上受到三个主要因素的影响:模型的神经网络架构、训练网络的方法以及训练数据。每个因素的改进都有助于模型整体性能的提高。神经网络架...

2023-01-12 22:26:50 121

原创 ​生成扩散模型漫谈:构建ODE的一般步骤(下)

©PaperWeekly 原创 ·作者 |苏剑林单位 |追一科技研究方向 |NLP、神经网络上周笔者写了《生成扩散模型漫谈:构建ODE的一般步骤(上)》,本以为已经窥见了构建 ODE 扩散模型的一般规律,结果不久后评论区大神 @gaohuazuo 就给出了一个构建格林函数更高效、更直观的方案,让笔者自愧不如。再联想起之前大神之前在《生成扩散模型漫谈:“硬刚”扩散ODE》同样也给出了一个关于...

2023-01-12 22:26:50 171

转载 ICLR 2023有哪些值得关注的GNN相关论文?

22年初,图神经网络(GNN)成为互联网圈的流行语,一整年,关于GNN的研究热情日益高涨,其已经成为各大深度学习顶会的研究热点。GNN处理非结构化数据时的出色能力使其在网络数据分析、推荐系统和自然语言处理等方面都取得了新的突破。步入23年之际,此文为大家回顾22年在GNN领域最新的研究综述以及研究趋势,我特地选了5篇具有代表性的文章为大家叙述,希望对在该领域想发论文的同学带来一些新思路!并且今天免...

2023-01-11 14:38:53 99

转载 最新综述:详细分析14种可用于时间序列预测的损失函数

©作者 |Spectator单位 |核桃量化研究方向 |量化投资论文标题:A Comprehensive Survey of Regression Based Loss Functions for Time Series Forecasting论文链接:https://arxiv.org/abs/2211.02989代码链接:https://github.com/aryan-jadon/Re...

2023-01-11 14:38:53 84

转载 北京内推 | 中移动金融科技有限公司招聘AI模型算法工程师

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中移动金融科技有限公司中移动金融科技有限公司(简称中移金科)是中国移动的全资子公司,依托主业独特优势和资源禀赋,拓展科技金融新领域,将通信用户转化为金融用户,打造国内最大的“通信+金融”生态圈。AI模型算法工程师坐标:北京岗位职责1. 负责人脸身份认证领域算法模型研发,包括但不...

2023-01-10 13:38:28 42

转载 博后招募 | 山东大学闵哲教授招聘智能手术机器人与医学图像处理方向博士后...

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!山东大学山东大学是坐落于“泉城”济南的一所 “985” “211”教育部直属全国重点大学。2017年9月,山东大学入选国家“双一流”世界一流大学建设高校(A类)名单。学校总占地面积8000余亩,形成了一校三地(济南、威海、青岛)的办学格局,是中国目前学科门类最齐全的大学之一,在...

2023-01-10 13:38:28 87

转载 AAAI 2023 | 均匀序列更好:时间间隔感知的序列推荐数据增强方法

©作者 |党翌洲单位 |东北大学研究方向 |推荐系统论文标题:Uniform Sequence Better: Time Interval Aware Data Augmentation for Sequential Recommendation论文来源:AAAI 2023作者单位:东北大学软件学院 阿里巴巴论文链接:https://arxiv.org/abs/2212.08262代码链接:...

2023-01-10 13:38:28 54

转载 ChatGPT——自然语言处理大结局?

2022年12月,全球科技圈最瞩目的明星莫过于ChatGPT。这一款来自Open.AI的“聊天机器人”,基本上你可以与它讨论任何话题,不管是简单的问路,还是深刻的哲学探讨,甚至是凭空生成一段代码,它几乎有求必应。用一句时髦的话讲,“自然语言处理大结局了”。从技术角度讲,ChatGPT是基于大规模预训练语言模型(GPT-3.5),借助其强大的语言理解和生成能力,通过在人工标注和反馈的大规模数据上进行...

2023-01-09 13:34:23 61

转载 博士申请 | 澳大利亚麦考瑞大学王岩教授招收机器学习方向全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!麦考瑞大学麦考瑞大学(Macquarie University)是位于澳大利亚新南威尔士州悉尼市的一所公立研究型大学,位于麦考瑞公园(Macquarie Park),是悉尼大都市地区设立的第三所大学,澳大利亚最富进取精神的大学之一。在QS 2022 Ranking 中,麦考瑞大...

2023-01-09 13:34:23 71

转载 北京内推 | 中国电信北京研究院招聘AI算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中国电信北京研究院中国电信股份有限公司北京研究院(原中国电信集团北京研究院)是中国电信集团公司为适应集团公司发展和电信市场竞争需要,于2001年4月18日挂牌成立的科研机构,旨在成为集团公司以及各省级公司的企业决策智库、技术创新引擎和产品创新孵化器。AI算法实习生坐标:北京岗位...

2023-01-09 13:34:23 61

转载 NeurIPS 2022 | 利用多光照信息的单视角NeRF算法,可恢复场景几何与材质信息

©作者 |杨雯琦来源|机器之心本文方法通过利用不同点光源下捕获的单视图图像学习神经反射场(neural reflectance field)以重建场景的 3D 几何和材质信息。与依赖于视图间照片一致性(photo-consistency)的多视图场景重建(multi-view scene reconstruction)不同,-NeRF 主要利用图像中的 shading 和 shadow 信息...

2023-01-09 13:34:23 138

转载 图神经网络设计中的算子融合策略

©作者 |刘曜齐单位|北京邮电大学硕士生来源|北邮GAMMA Lab本文主要的描述基于消息传递机制的图神经网络设计中应用的算子融合策略,带领读者了解有关算子融合的相关问题以及方法。引言目前,图神经网络(GNN)的程序编写主要依赖 GNN 框架,例如 PyG,DGL 等,并从中享受到高效的设计。现有的 GNN 设计大多基于消息传递机制,包括三大步骤:消息创建,消息聚合,特征更新。假定图 ...

2023-01-07 22:40:21 34

转载 噪声总是有害吗?西工大李学龙教授提出基于任务熵的数学分析框架

©作者 |张聪穆来源|机器之心在日常生活中,噪声无处不在,通常会给人及周围环境造成不良影响。比如,汽车产生的噪声给人们的正常工作和休息带来了不少困扰。然而,任何事物都有两面性。在一个不小心睡过了的早上,汽车噪声却会给人们释放出正向积极的信号:迟到了,该上班了。再例如,装修房子时电钻声非常嘈杂,对周边业主造成了干扰。但仔细听,从噪声中能分辨出钻的是木头还是钢铁,也能判断出电钻运转是否正常。这些...

2023-01-06 22:32:08 39

转载 北京/上海内推 | 微软亚洲研究院DKI组招聘因果机器学习算法实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院Cloud Intelligence 组是微软亚洲研究院DKI (Data, Knowledge & Intelligence) Area下专注于智能化云计算的研究团队,主要研究方向包括AI for System, AI for Customer 和AI ...

2023-01-06 22:32:08 59

转载 博士申请 | 香港中文大学(深圳)徐扬生院士团队招收人工智能全奖博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学 (深圳) 是一所经国家教育部批准,按中外合作办学条例设立,传承香港中文大学的办学理念和学术体系的大学。以创建一所立足中国、面向世界的一流研究型大学为己任,致力于培养具有国际视野、中华传统和社会担当的创新型高层次人才。理工学院秉承香港中文大学优良...

2023-01-06 22:32:08 108

原创 最新综述:基于语言模型提示学习的推理

©PaperWeekly 原创 ·作者 |OE-Heart引言推理能力是人类智能的核心能力之一。随着预训练技术的不断发展,大模型辅之以提示学习(如 Chain-of-Thought Prompting [1])涌现出一系列的惊人的推理能力,引起了学术界、工业界学者的广泛关注。本文介绍一篇「基于语言模型提示学习的推理」综述,其从提示学习的视角对各种前沿推理工作进行了系统的划分、梳理和对比(近期还...

2023-01-05 13:21:16 246

转载 Insight Time分享 | 决策大模型:不止于大!

预训练基础模型,已成为时下众多 AI 科技公司研究的热门领域。曾有评论称,预训练已成为了认知智能的核心技术。而预训练模型中一直强调的决策大模型,又是其中的重要一环,正在为决策 AI 研究带来意义深远的影响。决策大模型已在视频游戏、机器人交互操作以及具身导航场景下得到了广泛的应用。本期 Insight Time 前沿技术分享会,将和大家一起聊聊决策大模型的前沿技术方案,以及向大家介绍决策智能基础研究...

2023-01-05 13:21:16 47

转载 ACL 2022 | 基于长度感知注意机制的长度可控摘要模型

©作者 |孙川单位 |阿里巴巴研究方向 |问答系统以往的长度可控摘要模型大多在解码阶段控制长度,而编码阶段对指定的摘要长度不敏感。这样模型倾向于生成和训练数据一样长的摘要。在这篇论文中,作者提出了一种长度感知注意机制(LAAM,length-aware attention mechanism)来适应基于期望长度的编码。本文的方法是在由原始训练数据构建的摘要长度平衡数据集上训练 LAAM,然后...

2023-01-04 13:21:56 43

转载 AAAI 2023 | 动态温度超参蒸馏新方法

©作者 |Zheng Li单位 |南开大学一句话概括:相对于静态温度超参蒸馏,本文提出了简单且高效的动态温度超参蒸馏新方法。论文标题:Curriculum Temperature for Knowledge Distillation收录会议:AAAI 2023论文链接:https://arxiv.org/abs/2211.16231代码链接:https://github.com/zhengli...

2023-01-04 13:21:56 80

转载 AAAI 2023 | 自举多维度特征的虚假新闻检测

©作者 | Qichao Ying单位 |复旦大学研究方向 |多媒体与AI安全论文标题:Q Ying, X Hu, Y Zhou, Z Qian, D Zeng, S Ge. Bootstrapping Multi-view Representations for Fake News Detection. AAAI 2023.论文连接:https://arxiv.org/pdf/2206.05...

2023-01-03 13:22:12 110

转载 NeurIPS 2022 | 文本图片编辑新范式:单个模型实现多文本引导图像编辑

©作者 |机器之心编辑部来源|机器之心最近用文本来引导图像编辑取得了非常大的进展以及关注度,特别是基于去噪扩散模型如 StableDiffusion 或者 DALLE 等。但是基于 GAN 的文本 - 图像编辑依旧有一些问题等待解决,例如经典的 StyleCILP 中针对每一个文本必须要训练一个模型,这种单文本对单模型的方式在实际应用中是不方便的。本文我们提出 FFCLIP 并解决了这个问题...

2023-01-03 13:22:12 33

转载 从单幅自然图像学习扩散模型,优于GAN,SinDiffusion实现新SOTA

©作者 |袁铭怿来源|机器之心与现有的基于 GAN 的方法相比,SinDiffusion 显著提高了生成样本的质量和多样性。从单幅自然图像生成图像的技术被广为应用,也因此受到越来越多的关注。这一研究旨在从单幅自然图像中学习一个无条件生成模型,通过捕获 patch 内部统计信息,生成具有相似视觉内容的不同样本。一旦训练完成,模型不仅可以生成高质量且不限分辨率的图像,而且还可以轻松适应多种应用,...

2023-01-02 23:02:17 40

原创 生成扩散模型漫谈:构建ODE的一般步骤(上)

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络书接上文,在《生成扩散模型漫谈:从万有引力到扩散模型》中,我们介绍了一个由万有引力启发的、几何意义非常清晰的 ODE 式生成扩散模型。有的读者看了之后就疑问:似乎“万有引力”并不是唯一的选择,其他形式的力是否可以由同样的物理绘景构建扩散模型?另一方面,该模型在物理上确实很直观,但还欠缺从数学上证明最...

2022-12-30 22:33:27 365

转载 科研实习 | 阿联酋MBZUAI林智仁教授招聘文本分类方向研究助理/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!MBZUAI穆罕默德·本·扎耶德人工智能大学(MBZUAI),是全球首所专注于人工智能领域研究生培养和科研应用的大学。该大学位于阿布扎比马斯达尔城的高校园区,以阿联酋阿布扎比王储穆罕默德·本·扎耶德·阿勒纳哈扬的名字命名。穆罕默德·本·扎耶德人工智能大学的硕士和博士课程设置,聚...

2022-12-30 22:33:27 73

转载 NeurIPS 2022 | 面向图数据分布外泛化的因果表示学习

©作者 |Yongqiang Chen引言机器学习困境:相关性≠因果性随着深度学习模型的应用和推广,人们逐渐发现模型常常会利用数据中存在的虚假关联(Spurious Correlation)来获得较高的训练表现。但由于这类关联在测试数据上往往并不成立,因此这类模型的测试表现往往不尽如人意[1]。其本质是由于传统的机器学习目标(Empirical Risk Minimization,ERM)假设...

2022-12-30 22:33:27 83

转载 AI for Science的上半场:人工智能如何重新定义科学研究新范式?

AI发展七十余年,每一技术性突破都将给人类未来开辟新一种可能性。而它与科学研究的深度融合,则会裂变出无数或无穷种可能性。来源 |36氪万众瞩目下,今年10月,有着诺贝尔奖“嫡传”之称的诺贝尔化学奖终于揭晓,授予了对“链接化学和生物正交化学的发展作出了贡献”的三位化学家,他们分别是美国化学家Carolyn R. Bertozzi、丹麦化学家Morten Meldal、美国化学家K. Barry S...

2022-12-29 18:50:33 164

转载 AAAI 2023 | 从谱的角度来看待(图)对比学习

©作者 | 张逸飞单位| 香港中文大学研究方向 | 图数据挖掘前言我们主要来介绍一下我们在 AAAI 23(NeurIPS Fast Track)的中稿,SFA: Spectrum Feature Augmentation in Graph Contrastive Leanring and Beyond。可惜的是在 NeurIPS 的的分数是 7762,和其中一个审稿人针锋相对几回合后,最终还没...

2022-12-29 18:50:33 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除