2023年01月_PaperWeekly

转载最新综述：等变图神经网络

©作者 |王春辰单位 |北京邮电大学博士生来源|北邮GAMMA Lab本文旨在介绍近年等变图神经网络的进展，参考于最新的等变图神经网络综述。许多科学问题都需要处理几何图形的数据。不像一般的图数据，空间几何图形呈现平移，旋转和翻转的不变形。研究人员利用了这种特性设计了几何等变图神经网络（GNNs），以更好地表征几何图形的运算和拓扑。基于必要但简明的数学基础，本文分析并将现有的方法分为三类。等...

2023-01-31 23:10:49 2249

转载北京内推 | 智源人工智能研究院数据智能组招聘全职研究员/算法工程师

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！智源人工智能研究院北京智源人工智能研究院（Beijing Academy of Artificial Intelligence，BAAI）是人工智能领域的新型研发机构。2018年11月14日，在科技部和北京市支持下，联合北京多家人工智能领域优势单位共建。作为新型研发机构，智源研...

2023-01-31 23:10:49 459

转载玩游戏学CUDA？试试这个可视化解谜项目

©作者 | 李逸清单位 | 宁波大学本科生研究方向 | 计算机视觉本来打算寒假学学 CUDA，在 github 上找些项目研究一下，然后碰到一个超好玩的东西——一个可视化的 CUDA 解谜项目！https://github.com/srush/GPU-Puzzles第一题 - MapImplement a "kernel" (GPU function) that adds 10 to each p...

2023-01-31 23:10:49 191

转载投稿招募 | 首届多模态可穿戴信号理解AmbientAI Workshop @ ICASSP 2023

背景 Background可穿戴设备通常配备多个环境传感器，例如记录线性和旋转运动（通过加速度计、陀螺仪等）的 IMU 传感器，或可用于测量更多局部和微运动的 EMG 传感器。这些新的计算设备为新型交互提供了机会，允许用户提供更主动的以及跟上下文相关的帮助，等。鉴于它们的低功耗，这些环境运动传感器信号可以作为一个关键的模态，为需要了解设备佩戴者的运动模式的各种设备模型（例如健康应用的锻炼/活动识别...

2023-01-30 19:43:42 386 1

转载博士申请 | 上海交通大学叶南阳老师招收计算机视觉/机器学习方向博士生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！上海交通大学上海交通大学约翰·霍普克罗夫特计算机科学中心于 2017 年 1 月正式成立，以图灵奖得主、中科院外籍院士、上海交通大学访问讲席教授 John Hopcroft 的名字命名，由他亲自担任主任。中心的使命在于创建宽松自由的国际化学术环境，招募深具潜力的青年学者，助力他...

2023-01-29 13:18:30 1471

转载 NeurIPS 2022 | C-mixup：扩展mixup提高回归任务的模型泛化性

©作者 | spectator单位 |核桃量化研究方向 |量化投资本文简要深度学习从业者通常面临过度拟合的挑战，为了改进泛化，先前的工作已经提出了许多技术，包括数据扩增和显式正则化。其中最典型的工作是 mixup，其通过对随机采样的样本对的特征进行线性插值并对相应的标签应用相同的插值来完成数据增广，达到隐式地正则化效果。虽然 mixup 在提高分类问题的泛化能力方面表现出了良好的效果，但在连续...

2023-01-28 21:12:01 410

原创 Transformer升级之路：长度外推性与局部注意力

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络对于 Transformer 模型来说，其长度的外推性是我们一直在追求的良好性质，它是指我们在短序列上训练的模型，能否不用微调地用到长序列上并依然保持不错的效果。之所以追求长度外推性，一方面是理论的完备性，觉得这是一个理想模型应当具备的性质，另一方面也是训练的实用性，允许我们以较低成本（在较短序列上...

2023-01-28 21:12:01 1504

转载萌兔送福！PaperWeekly专属红包封面来啦~

SPRINGFESTIVAL红红火火恍恍惚惚期待了一整年的春节终于要来了！小时候过春节最开心的事就是收压岁钱长大了以后我变成了发压岁钱的那个人于是最开心的事变成了……收集各种红包封面感谢大家一年来的陪伴和爱兔年春节PaperWeekly也为大家准备了专属红包封面！兔年限定的红包封面来自我们的设计师亲笔手绘红红火火喜喜庆庆可爱小兔子挥笔送祝福祝PaperWeekly的读者朋友们兔年行大运论文多...

2023-01-20 18:44:38 248

原创还在想办法提升人脸防伪泛化吗？仅靠人脸系统现有知识即可让性能大幅提升...

©PaperWeekly 原创 ·作者 |张文天单位 | 深圳大学计算机视觉所研究方向|人脸防伪在人脸识别系统中，通常会在人脸识别模块之前设置一个独立的人脸防伪模块，用于保障系统安全性。由于真实场景中的人脸伪造攻击的方式多种多样，无法全面收集，这种高度依赖于有限训练集的学习型方法很难对所有攻击方式进行预测，不能有效地推广到未知的攻击中。与人脸防伪任务不同，其他人脸相关任务（例如人脸识别和属...

2023-01-19 19:08:35 937

转载 NeurIPS 2022 | 基于结构聚类的异质图自监督学习

来源 | 北邮 GAMMA Lab论文作者：杨亚明，管子玉，王哲，赵伟，徐偲，陆维港，黄健斌论文单位：西安电子科技大学，计算机科学与技术学院引言现阶段，图（Graph）上的自监督学习大多都遵循图对比学习框架，这些方法通常需要先构造一系列的正样本对以及负样本对，然后通过在低维表示空间中拉近正样本并且推远负样本来学习节点/图的表示。目前，研究者们已经探索了节点丢弃、连边扰动等各种生成正样本的策略，以及...

2023-01-19 19:08:35 465

原创 CVPR 2022 | ELP：简单间断线性探针即可提升各种分类性能

©PaperWeekly 原创 ·作者 | 梁远智单位 | 悉尼科技大学博士生研究方向 |多模态与表示学习自序分类是 CV 经典任务。在之前的工作中（MHEM TNNLS2022），针对 FGVC，我们曾经尝试跳出修改结构（FGVC 中主要是各种 part based model）和引入数据等固有思路，尝试通过更加更加简单有效的方式提升性能。我们惊讶地发现，简单的适当的困难样本挖掘足以明显的提...

2023-01-18 14:15:23 767

转载北京内推 | 微软亚洲互联网工程院（STCA）招聘科研实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软亚洲互联网工程院微软 STCA MSPH Intelligence TEAM 由多位人工智能领域的科学家和工程师组成，团队成员均为北大硕博，且具有微软亚洲研究院、北大计算语言所、百度 IDL 研究院等机构的丰富科研经验，致力于 DL/ML 基础技术的研究与应用。团队与微软亚...

2023-01-18 14:15:23 698

转载北京内推 | 微软亚洲研究院DKI组招聘大模型方向研究实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软亚洲研究院Cloud Intelligence组是微软亚洲研究院DKI (Data, Knowledge & Intelligence) Area下专注于智能化云计算的研究团队，主要研究方向包括AI for System, AI for Customer 和AI f...

2023-01-17 22:15:31 778

转载 AAAI 2023 | 基于T5的两阶段的多任务Text-to-SQL预训练模型MIGA

©作者 |网易互娱AI Lab来源|机器之心网易互娱 AI Lab 联合广东外语外贸大学和哥伦比亚大学基于预训练语言模型 T5 的预训练方式，提出了两阶段的多任务预训练模型 MIGA。越来越多的工作证明了预训练语言模型（PLM）中蕴含着丰富的知识，针对不同的任务，用合适的训练方式来撬动 PLM，能更好地提升模型的能力。在 Text-to-SQL 任务中，目前主流的生成器是基于语法树的，需要针...

2023-01-17 22:15:31 338

原创通用视觉预训练大模型巡礼系列（一）：UFO大模型

©PaperWeekly 原创 ·作者 |张燚钧单位 |中国移动云能力中心研究方向 |预训练大模型近来，以 ChatGPT 为代表的自然语言对话大模型，以及以 Stable Diffusion 为代表的多模态文图生成大模型展现出惊艳的效果。而面向视觉领域的通用视觉模型相对来说似乎略显冷清。事实上，从 2021 年商汤联合上海人工智能实验室发布“书生”通用视觉体系以及在 2022 年世界人工...

2023-01-17 22:15:31 930

原创 NeurIPS 2022 | 基于稀疏学习的提升模型泛化能力算法

©PaperWeekly 原创 ·作者 |GlobalTrack深度学习模型经常遇到较弱的泛化能力等问题。由于损失函数景观（loss landscape）一般是复杂的且非凸，该特性使模型常常收敛到尖锐最小点（Sharp Minima）。一般认为最小值点附近越平滑，模型泛化能力越强。Sharpness-Aware Minimization（SAM）方法是一种可以提升模型泛化能力的算法，可以同时...

2023-01-13 21:20:30 869

转载 AAAI 2023 | 基于多模态标签聚合的视频检索模型TABLE，多项SOTA

©作者 |QQ浏览器搜索技术中心、腾讯PCG ARC Lab来源|机器之心近年来，互联网短小视频内容的爆发式增长，对视频 - 文本检索（Video-Text Retrieval）的能力提出了更高的要求。在 QQ 浏览器搜索中，视频通常包含标题、封面图、视频帧、音频等多种模态信息，因此视频检索模型引入了多模态特征，以刻画 query 与视频在多个模态上的相关程度，并进行综合排序，提升视频搜索结...

2023-01-13 21:20:30 635

转载 Meta发布ConvNeXt V2！仅用最简单的卷积架构，性能不输Transformer

©作者 |机器之心编辑部来源|机器之心ConvNeXt 模型更新了！经过几十年的基础研究，视觉识别领域已经迎来了大规模视觉表征学习的新时代。预训练的大规模视觉模型已经成为特征学习（feature learning）和视觉应用的基本工具。视觉表征学习系统的性能在很大程度上受到三个主要因素的影响：模型的神经网络架构、训练网络的方法以及训练数据。每个因素的改进都有助于模型整体性能的提高。神经网络架...

2023-01-12 22:26:50 931

原创生成扩散模型漫谈：构建ODE的一般步骤（下）

©PaperWeekly 原创 ·作者 |苏剑林单位 |追一科技研究方向 |NLP、神经网络上周笔者写了《生成扩散模型漫谈：构建ODE的一般步骤（上）》，本以为已经窥见了构建 ODE 扩散模型的一般规律，结果不久后评论区大神 @gaohuazuo 就给出了一个构建格林函数更高效、更直观的方案，让笔者自愧不如。再联想起之前大神之前在《生成扩散模型漫谈：“硬刚”扩散ODE》同样也给出了一个关于...

2023-01-12 22:26:50 546

转载 ICLR 2023有哪些值得关注的GNN相关论文？

22年初，图神经网络（GNN）成为互联网圈的流行语，一整年，关于GNN的研究热情日益高涨，其已经成为各大深度学习顶会的研究热点。GNN处理非结构化数据时的出色能力使其在网络数据分析、推荐系统和自然语言处理等方面都取得了新的突破。步入23年之际，此文为大家回顾22年在GNN领域最新的研究综述以及研究趋势，我特地选了5篇具有代表性的文章为大家叙述，希望对在该领域想发论文的同学带来一些新思路！并且今天免...

2023-01-11 14:38:53 963 1

转载最新综述：详细分析14种可用于时间序列预测的损失函数

©作者 |Spectator单位 |核桃量化研究方向 |量化投资论文标题：A Comprehensive Survey of Regression Based Loss Functions for Time Series Forecasting论文链接：https://arxiv.org/abs/2211.02989代码链接：https://github.com/aryan-jadon/Re...

2023-01-11 14:38:53 988

转载北京内推 | 中移动金融科技有限公司招聘AI模型算法工程师

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！中移动金融科技有限公司中移动金融科技有限公司（简称中移金科）是中国移动的全资子公司，依托主业独特优势和资源禀赋，拓展科技金融新领域，将通信用户转化为金融用户，打造国内最大的“通信+金融”生态圈。AI模型算法工程师坐标：北京岗位职责1. 负责人脸身份认证领域算法模型研发，包括但不...

2023-01-10 13:38:28 404

转载博后招募 | 山东大学闵哲教授招聘智能手术机器人与医学图像处理方向博士后...

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！山东大学山东大学是坐落于“泉城”济南的一所 “985” “211”教育部直属全国重点大学。2017年9月，山东大学入选国家“双一流”世界一流大学建设高校（A类）名单。学校总占地面积8000余亩，形成了一校三地（济南、威海、青岛）的办学格局，是中国目前学科门类最齐全的大学之一，在...

2023-01-10 13:38:28 1254

转载 AAAI 2023 | 均匀序列更好：时间间隔感知的序列推荐数据增强方法

©作者 |党翌洲单位 |东北大学研究方向 |推荐系统论文标题：Uniform Sequence Better: Time Interval Aware Data Augmentation for Sequential Recommendation论文来源：AAAI 2023作者单位：东北大学软件学院阿里巴巴论文链接：https://arxiv.org/abs/2212.08262代码链接：...

2023-01-10 13:38:28 461

转载 ChatGPT——自然语言处理大结局？

2022年12月，全球科技圈最瞩目的明星莫过于ChatGPT。这一款来自Open.AI的“聊天机器人”，基本上你可以与它讨论任何话题，不管是简单的问路，还是深刻的哲学探讨，甚至是凭空生成一段代码，它几乎有求必应。用一句时髦的话讲，“自然语言处理大结局了”。从技术角度讲，ChatGPT是基于大规模预训练语言模型（GPT-3.5），借助其强大的语言理解和生成能力，通过在人工标注和反馈的大规模数据上进行...

2023-01-09 13:34:23 398

转载博士申请 | 澳大利亚麦考瑞大学王岩教授招收机器学习方向全奖博士生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！麦考瑞大学麦考瑞大学（Macquarie University）是位于澳大利亚新南威尔士州悉尼市的一所公立研究型大学，位于麦考瑞公园（Macquarie Park），是悉尼大都市地区设立的第三所大学，澳大利亚最富进取精神的大学之一。在QS 2022 Ranking 中，麦考瑞大...

2023-01-09 13:34:23 907

转载北京内推 | 中国电信北京研究院招聘AI算法实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！中国电信北京研究院中国电信股份有限公司北京研究院（原中国电信集团北京研究院）是中国电信集团公司为适应集团公司发展和电信市场竞争需要，于2001年4月18日挂牌成立的科研机构，旨在成为集团公司以及各省级公司的企业决策智库、技术创新引擎和产品创新孵化器。AI算法实习生坐标：北京岗位...

2023-01-09 13:34:23 644

转载 NeurIPS 2022 | 利用多光照信息的单视角NeRF算法，可恢复场景几何与材质信息

©作者 |杨雯琦来源|机器之心本文方法通过利用不同点光源下捕获的单视图图像学习神经反射场（neural reflectance field）以重建场景的 3D 几何和材质信息。与依赖于视图间照片一致性（photo-consistency）的多视图场景重建（multi-view scene reconstruction）不同，-NeRF 主要利用图像中的 shading 和 shadow 信息...

2023-01-09 13:34:23 510

转载图神经网络设计中的算子融合策略

©作者 |刘曜齐单位|北京邮电大学硕士生来源|北邮GAMMA Lab本文主要的描述基于消息传递机制的图神经网络设计中应用的算子融合策略，带领读者了解有关算子融合的相关问题以及方法。引言目前，图神经网络（GNN）的程序编写主要依赖 GNN 框架，例如 PyG，DGL 等，并从中享受到高效的设计。现有的 GNN 设计大多基于消息传递机制，包括三大步骤：消息创建，消息聚合，特征更新。假定图 ...

2023-01-07 22:40:21 790

转载噪声总是有害吗？西工大李学龙教授提出基于任务熵的数学分析框架

©作者 |张聪穆来源|机器之心在日常生活中，噪声无处不在，通常会给人及周围环境造成不良影响。比如，汽车产生的噪声给人们的正常工作和休息带来了不少困扰。然而，任何事物都有两面性。在一个不小心睡过了的早上，汽车噪声却会给人们释放出正向积极的信号：迟到了，该上班了。再例如，装修房子时电钻声非常嘈杂，对周边业主造成了干扰。但仔细听，从噪声中能分辨出钻的是木头还是钢铁，也能判断出电钻运转是否正常。这些...

2023-01-06 22:32:08 194

转载北京/上海内推 | 微软亚洲研究院DKI组招聘因果机器学习算法实习生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软亚洲研究院Cloud Intelligence 组是微软亚洲研究院DKI (Data, Knowledge & Intelligence) Area下专注于智能化云计算的研究团队，主要研究方向包括AI for System, AI for Customer 和AI ...

2023-01-06 22:32:08 403

转载博士申请 | 香港中文大学（深圳）徐扬生院士团队招收人工智能全奖博士生

合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港中文大学（深圳）香港中文大学 (深圳) 是一所经国家教育部批准，按中外合作办学条例设立，传承香港中文大学的办学理念和学术体系的大学。以创建一所立足中国、面向世界的一流研究型大学为己任，致力于培养具有国际视野、中华传统和社会担当的创新型高层次人才。理工学院秉承香港中文大学优良...

2023-01-06 22:32:08 850

原创最新综述：基于语言模型提示学习的推理

©PaperWeekly 原创 ·作者 |OE-Heart引言推理能力是人类智能的核心能力之一。随着预训练技术的不断发展，大模型辅之以提示学习（如 Chain-of-Thought Prompting [1]）涌现出一系列的惊人的推理能力，引起了学术界、工业界学者的广泛关注。本文介绍一篇「基于语言模型提示学习的推理」综述，其从提示学习的视角对各种前沿推理工作进行了系统的划分、梳理和对比（近期还...

2023-01-05 13:21:16 1471

转载 Insight Time分享 | 决策大模型：不止于大！

预训练基础模型，已成为时下众多 AI 科技公司研究的热门领域。曾有评论称，预训练已成为了认知智能的核心技术。而预训练模型中一直强调的决策大模型，又是其中的重要一环，正在为决策 AI 研究带来意义深远的影响。决策大模型已在视频游戏、机器人交互操作以及具身导航场景下得到了广泛的应用。本期 Insight Time 前沿技术分享会，将和大家一起聊聊决策大模型的前沿技术方案，以及向大家介绍决策智能基础研究...

2023-01-05 13:21:16 798

转载 ACL 2022 | 基于长度感知注意机制的长度可控摘要模型

©作者 |孙川单位 |阿里巴巴研究方向 |问答系统以往的长度可控摘要模型大多在解码阶段控制长度，而编码阶段对指定的摘要长度不敏感。这样模型倾向于生成和训练数据一样长的摘要。在这篇论文中，作者提出了一种长度感知注意机制（LAAM，length-aware attention mechanism）来适应基于期望长度的编码。本文的方法是在由原始训练数据构建的摘要长度平衡数据集上训练 LAAM，然后...

2023-01-04 13:21:56 187

转载 AAAI 2023 | 动态温度超参蒸馏新方法

©作者 |Zheng Li单位 |南开大学一句话概括：相对于静态温度超参蒸馏，本文提出了简单且高效的动态温度超参蒸馏新方法。论文标题：Curriculum Temperature for Knowledge Distillation收录会议：AAAI 2023论文链接：https://arxiv.org/abs/2211.16231代码链接：https://github.com/zhengli...

2023-01-04 13:21:56 618 1

转载 AAAI 2023 | 自举多维度特征的虚假新闻检测

©作者 | Qichao Ying单位 |复旦大学研究方向 |多媒体与AI安全论文标题：Q Ying, X Hu, Y Zhou, Z Qian, D Zeng, S Ge. Bootstrapping Multi-view Representations for Fake News Detection. AAAI 2023.论文连接：https://arxiv.org/pdf/2206.05...

2023-01-03 13:22:12 1623 1

转载 NeurIPS 2022 | 文本图片编辑新范式：单个模型实现多文本引导图像编辑

©作者 |机器之心编辑部来源|机器之心最近用文本来引导图像编辑取得了非常大的进展以及关注度，特别是基于去噪扩散模型如 StableDiffusion 或者 DALLE 等。但是基于 GAN 的文本 - 图像编辑依旧有一些问题等待解决，例如经典的 StyleCILP 中针对每一个文本必须要训练一个模型，这种单文本对单模型的方式在实际应用中是不方便的。本文我们提出 FFCLIP 并解决了这个问题...

2023-01-03 13:22:12 198

转载从单幅自然图像学习扩散模型，优于GAN，SinDiffusion实现新SOTA

©作者 |袁铭怿来源|机器之心与现有的基于 GAN 的方法相比，SinDiffusion 显著提高了生成样本的质量和多样性。从单幅自然图像生成图像的技术被广为应用，也因此受到越来越多的关注。这一研究旨在从单幅自然图像中学习一个无条件生成模型，通过捕获 patch 内部统计信息，生成具有相似视觉内容的不同样本。一旦训练完成，模型不仅可以生成高质量且不限分辨率的图像，而且还可以轻松适应多种应用，...

2023-01-02 23:02:17 333

空空如也

空空如也