公众号内容拓展学习笔记(2021.5.12)
📎 今日要点
-
PVT:可用于密集任务backbone的金字塔视觉transformer! ⭐️⭐️
- Abstract: 可用于密集任务backbone的金字塔视觉transformer PVT
- Paper: Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions
- Code: https://github.com/whai362/PVT
- Tips: 实现了一种多阶段具有不同分辨率的Transformer Vision的Backbone
-
TPAMI 2021 :基于 event stream 的步态识别,准确率高达90%! ⭐️⭐️
- Abstract: 基于 event stream 的步态识别
- Paper: Event-Stream Representation for Human Gaits Identification Using Deep Neural Networks
- Code: https://github.com/zhangxiann/TPAMI_Gait_Identification
- Tips: 本文基于 event stream 的两种不同表示形式,即 image-like representation 和 graph representation,提出了一种新的基于 event stream 的步态识别方法
-
CVPR 2021 | 任何人都能“不讲武德”,姿态可控的语音驱动说话人脸 ⭐️⭐️
- Abstract: 人头姿态可控的语音驱动任意说话人脸生成
- Paper: Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation
- Code: https://github.com/Hangz-nju-cuhk/Talking-Face_PC-AVS
- Tips: 隐式地在潜空间(latent space)中定义了一个12维的姿态编码,用于头部运动控制
-
基于GAN来做低光照图像增强,EnlightenGAN论文解读 ⭐️⭐️
- Abstract: 没有配对监督的深度光增强EnlightenGAN
- Paper: EnlightenGAN: Deep Light Enhancement without Paired Supervision
- Code: https://github.com/yueruchen/EnlightenGAN
- Tips:
- 基于生成对抗网络GAN提出了用于低光图像增强的网络结构EnlightenGAN,并且第一次采用了不成对图像进行训练
- 提出了一种双重鉴别器来平衡全局增强和局部增强
- 提出了一种新的自正则化感知损失函数用于模型训练
-
基于卷积神经网络的实时火焰检测 ⭐️⭐️
- Abstract: 基于卷积神经网络的实时火焰检测
- Paper: Experimentally Defined Convolutional Neural Network Architecture Variants for Non-temporal Real-time Fire Detection
- Code: https://github.com/tobybreckon/fire-detection-cnn
- Tips: 通过不依靠时间上的场景信息,针对视频或者静态图像,作者研究了自动检测火焰区域的算法。
-
【招聘】AIR人工智能与生物计算教师/工程师/博士后/实习生 ⭐️⭐️
- Abstract: AIR人工智能与生物计算教师/工程师/博士后/实习生
- Contact: airhr@air.tsinghua.edu.cn
- Tips: 清华大学智能产业研究院(Institute for AI Industry Research, Tsinghua University,英文简称AIR)是面向第四次工业革命的国际化、智能化、产业化的应用研究机构