文献笔记：RhythmNet: End-to-end Heart Rate Estimation from Face via Spatial-temporal Representation

weixin_53939670

已于 2022-06-23 11:51:45 修改

阅读量1.1k

点赞数

文章标签： python 卷积神经网络人工智能

于 2022-06-17 12:46:22 首次发布

本文链接：https://blog.csdn.net/weixin_53939670/article/details/125331465

版权

一、研究背景与意义

从人脸视频中进行远程HR估计具有广泛的应用，但由于头部运动、照明和传感器多样性的变化，在约束较少的场景中，这是一个具有挑战性的问题。

1.在本文中，提出了一种端到端的RyhthmNet，用于从人脸进行远程HR估计。在RyhthmNet中，时空分布图表示的来自多个ROI区域的HR信号作为其输入，进行HR估计。

2.还考虑了通过门控循环单元(GRU)从视频序列中获得的相邻HR测量的关系，从而实现高效的HR测量。

3.此外，还构建了一个大规模的多模态HR数据库(命名为VIPL-HR1)，包含了107名受试者的2,378个可见光视频(VIS)和752个近红外视频(NIR)。VIPL-HR数据库包含各种变化，如头部运动、照明变化和采集设备变化，为HR估计复制了一个较少约束的场景。该方法在公共领域和我们的VIPL-HR数据库上都优于最先进的方法。

二、研究内容

（1）VIPL-HR数据库

1.数据收集：人脸视频记录条件应涵盖环境照明、受试者姿态、采集传感器以复制日常应用场景。

从直方图中，我们可以看到受试者的最大旋转幅度变化很大

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_53939670

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

STA: Spatial-Temporal Attention for Large-Scale Video-based Person Re-Identification

博客

05-14

1473

Abstract In this work, we propose a novel Spatial-Temporal Attention (STA) approach to tackle the large-scale person re-identification task in videos. Different from the most existing methods, which s...

【AI视野·今日CV 计算机视觉论文速览第166期】Mon, 28 Oct 2019

TomRen

10-29

2146

AI视野·今日CS.CV 计算机视觉论文速览 --风格迁移 --深度图像融合方法 --多人光流检测 --同类显著性检测

参与评论您还未登录，请先登录后发表或查看评论

基于面部视频的远程实时心率监测系统 day 13

周子博的博客

03-29

811

调试欧拉放大算法颜色转换YIQ后变成粉色，转换回来后都变成白的了。继续调试，看看如何解决。

基于面部视频的远程心率监测系统 DAY 13

周子博的博客

03-27

853

设置interest（人脸区域）mat 在调用IMshow时会出现 R6010 -abort() has been called错误我这个小白不知道如何解决：在网上查找有如下原因： 1.非法指针访问和内存泄漏 2.设置的指针范围跟你运行的不对 3.指针访问内存越界出现问题。 4.因为不支持中文。 5.内存不够分配 6.多线程访问资源出的问题。 7.检查exe和dll是否混用的不同版本的crt ...

Deep Learning Methods for Remote Heart Rate Measurement:A Review and Future Research Agenda

m0_46792836的博客

11-15

6933

前言本文为一片远程心率监测综述的总结复述，本文为作者第一篇试写博客，欢迎大家提出宝贵意见。文章主要内容：1.简述了有关远程心率监测的基础知识与相关概念。2.讨论了基于深度学习的远程心率检测方法的几个最新进展，并根据模型体系结构和应用情况进行了分类。3.进一步详述了远程生理监测的相关现实应用，并总结了用于加速相关研究进展的各种常见资源。4.分析了研究成果的意义，并讨论了该领域未来发展方向的研究空白。5.简述与该领域有关的常见基础知识。简介心率(HR)是反映人体生理健康状...

挑战一个月完成一篇论文初稿

qq_44925645的博客

07-01

416

一起学习

刘翔中科院计算机研究所,专家人才库数据----中国科学院计算技术研究所

weixin_39942037的博客

07-24

254

[1] Yong Li, Jiabei Zen#, Shiguang Shan. Learning Representations for Facial Actions from Unlabeled Videos. IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI, Accepted on Jul.10, ...

原创 | 假期必读：一文看尽2019-2020各大顶会GNN论文（附链接）

数据派THU

01-20

3054

纵观2019年包括深度学习、计算机视觉、文本处理以及数据挖掘在内的顶级会议，图学习相关的论文较于之前都有十分明显的增长。而就 2020的情况来看，这个趋势还在不断扩大。总之，Graph ...

论文阅读-《Global-to-Local Modeling for Video-Based 3D Human Pose and Shape Estimation》

最新发布

zyd_994264926326的博客

09-09

910

GLoT 是一种针对基于视频的 3D 人体姿态和形状估计的全局到局部建模方法。它通过结合深度神经网络和人体的先验结构来捕捉长时依赖（long-range global dependency）和局部细节

从看脸到读心：深度理解人的视觉技术走到哪了？

喜欢打酱油的老鸟

05-18

1255

2020-05-15 23:07:56 作者 | 蒋宝尚编辑 | 贾伟 AI 正在尝试攻克“读心术”。随着人脸识别为代表的“看脸”技术已经逐渐走向成熟，越来越多的科学家正在攻克这个难题。利用AI算法，捕捉面部特征所承载的多维信息，分析推断一个人精神状况，从人工智能的角度就变成了输入表情，输出性格、情绪、心理活动的“函数”映射问题。其中输入的特征可以是微表情，也可以是视线等；输出结果可以是喜怒哀乐等情绪。举例来说，荷兰阿姆斯特丹大学的尼克·瑟比博士曾利用现代的深度学习方法对蒙娜丽莎的“情绪

从学习速率中解开自适应梯度法（Disentangling Adaptive Gradient）.pdf

03-05

我们研究了深度学习优化算法评估中的几个混合因素。首先，我们深入研究自适应梯度方法如何与学习速率调整相互作用，这是一个众所周知的难以调整的超参数，它对神经网络训练的收敛和推广具有显着影响。我们引入了一个“嫁接”实验，该实验将更新的大小与其方向解耦，发现文献中的许多现有信念可能是由于对步长的隐式时间表的隔离不足而产生的。除了这一贡献之外，我们还对自适应梯度方法的推广进行了一些实证和理论回顾，旨在为这一空间带来更清晰的视角。

CVD-Physiological-Measurement:通过交叉验证的特征解缠，基于视频的远程生理测量。（ECCV2020口头）

05-18

CVD生理测量这是纸张的源代码（口服），于子，胡涵，李小白，山石光，赵国英2020年欧洲计算机视觉会议（ECCV）。环境该代码基于Matlab2018b，Python2.7和Pytorch 0.4.1 数据有关VIPL-HR数据库，请参考。可以使用访问VIP1-HR数据库的扩展版本（VIPL-HR-V2）。有关OBF数据库的更多信息，请联系。数据处理 MSTmap生成过程基于Matlab。请参阅MSTmap_generation文件夹以获取更多信息。同时支持（81个地标）和（68个地标）面部标志检测引擎。训练此代码只是培训过程的一个玩具示例。提供了所有的网络结构和损耗。您需要根据自己的数据调整数据加载器以及培训和测试功能。接触如果您对该项目有任何疑问或其他有趣的想法，请随时与我联系（ xuesong.niu@vipl.ict.ac.cn ）。

RTrPPG: An Ultra Light 3DCNN for Real-Time Remote Photoplethysmography

weixin_45492599的博客

02-27

1057

远程光电容积脉搏波描记法（rPPG）信号的采集在多种应用中具有重要意义。最近，基于深度学习的方法，如3D卷积网络（3dcnn）已经优于传统的手工制作方法。然而，尽管它们具有强大的建模能力，但众所周知，大型3DCNN模型具有较高的计算成本，可能不适合实时应用。在本文中，我们提出了一个对3DCNN架构的研究，找到了心率测量精度和推断时间之间的最佳折衷方案。

PhysFormer

不要錯過才珍惜

11-21

765

在本文中提出了一种用于远程生理测量的端到端视频 Transformer 架构，即 PhysFormer。通过时间差 Transformer 和动态监督使得 PhysFormer 能够在基准数据集上实现卓越的性能。基于 Video Transformer 的生理测量研究仍处于早期阶段。设计更高效的架构。提出的 PhysFormer 参数为 7.03 M，GFLOPs 为 47.01，不利于移动部署探索更准确、更高效的时空自注意力机制，尤其是对于长序列rPPG监测。

深度学习实验——蒸馏模型实战（一）

qq_44925645的博客

08-16

1474

代码复现，实战

Methods on detecting Physiogical Status

weixin_43937759的博客

06-04

816

Heart Rate1 1. Traditional HR measurements Relay on contact monitors(ECG) -> cause inconvenience and discomfort Contact photoplethysmography( cPPG )based sensors 2. Recently, remote HR estimation from face videos, allows HR estimation from the skin. i

CVPR2020 | 中科院VIPL实验室录取论文详解

深度学习大讲堂

03-09

2308

编者按：近日，计算机视觉顶会 CVPR 2020 接收论文结果揭晓，从 6656 篇有效投稿中录取了 1470 篇论文，录取率约为 22%。中科院VIPL实验室共七篇论文录取，内容涉及弱...

OBF database （心率和呼吸率数据集）

keyanxiaocaicai的专栏

04-17

7097

obf 数据集是一个新发布的心率测试集这个数据集是想解决现有的两个问题： 1. 如何公平的评价现有的算法，目前的算法主要评测的是在MMSE-HR 和 2.Are the methods sufficently acurate for medical purposes? 这些方法是否足够准确地用于医疗目的？最关心的问题：这个数据集应该暂时还没有开源，数据之前申请采集方法：（E...

深度学习中的遥感影像数据集~持续更新