学术速递4 | 谷歌混合精度量化 | 清华语音人脸视频生成 | 谭铁牛步态识别对抗攻击 | 北大点云数据

最新推荐文章于 2024-04-13 09:57:55 发布

arXivDaily

最新推荐文章于 2024-04-13 09:57:55 发布

阅读量1.5k

点赞数 1

文章标签：自然语言处理自动驾驶深度学习计算机视觉

本文链接：https://blog.csdn.net/Small_cainiao/article/details/104554865

版权

几篇近期的paper：

清华：音频驱动的具有自然头部姿势的语音人脸视频生成
谭铁牛：对步态识别的时间稀疏对抗性攻击
Google Brain：无需专用硬件加速的混合精度量化
北大：SemanticPOSS-具有大量动态实例的点云数据集

1. 清华：音频驱动的具有自然头部姿势的语音人脸视频生成

类似于AI虚拟主播，根据声音生成视频，嘴型和头的姿态越来越自然……Fake News批量化生产指日可待【狗头】，先看一段视频，不是本文的Demo哈，是一张图片生成视频的：

语音人脸视频生成Demo

AI视频生成

标题：Audio-driven Talking Face Video Generation with Natural Head Pose
机构：清华、中科大、

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

arXivDaily

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

基于MATLAB的人脸识别研究

TuTu998的博客

09-01

1773

基于MATLAB的人脸识别研究【摘要】深入分析了主成分分析（Principal Component Analysis，PCA）方法的基本原理，PCA方法最显著的优点是能用低维特征向量来估计原始样本，基于此特点将它用来实现对人脸的识别。此外本文还深入分析了PCA中遇到的特征值选择和距离准则的选取问题。【关键词】MATLAB；数字图像处理；人脸识别 1.引...

Audio-driven-TalkingFace-HeadPose:“基于学习的个性化头姿势的音频驱动的有声面部视频生成”的代码

05-02

基于学习的个性化头姿势的音频驱动的会说话的面部视频生成我们为arxiv论文“基于学习的个性化头部姿势的音频驱动的有声面部视频生成”（）提供PyTorch实施。请注意，此代码受专利保护。仅出于您的大学（研究机构）的研究目的。如果您对商业目的/营利目的感兴趣，请联系刘教授（通讯作者，电子邮件：）。我们提供了一个演示视频（请在此页面中搜索“ Talking Face”，然后单击“演示视频”按钮）。我们的拟议框架先决条件 Linux或macOS NVIDIA GPU 的Python 3 的MATLAB 入门安装您可以创建一个虚拟环境，并通过以下方式安装所有依赖项： pip install -r requirements.txt 下载预训练的模型包括预训练的通用模型和面部重建，身份特征提取等所需的模型从（提取代码：usdm）或下载，然后复制到相应的子文件夹（

参与评论您还未登录，请先登录后发表或查看评论

仅用语音，AI就能“脑补”你的脸！ | 技术头条

AI科技大本营

04-05

2514

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」，购票请扫码咨询 ↑↑↑作者 | Wav2pix 研究团队译者 | 刘畅编辑 | Jane出品 | AI科...

论文阅读: [3d]Audio-driven Talking Face Video Generation with Learning-based Personalized Head Pose

landing_guy_的博客

07-14

1503

介绍使用3d人脸做生成的工作

混合精度量化模型指标模拟计算（BitOps与参数规模）

qq_39068200的博客

03-17

772

本文提取了LIMPQ算法源码，实现了混合精度量化模型的BitOps和参数规模的计算。

大模型训练之计算量和内存优化篇------混合精度/量化/FSDP&cpu offload/Gradient Checkpointing

weixin_36378508的博客

05-24

3348

大模型训练显存和计算量优化

视频生成高精度对象建议的弱监督对象检测方法

9414你收获你所播种的使用视频生成高精度对象建议，用于弱监督对象检测Krishna Kumar Singh和Yong Jae Lee加州大学戴维斯摘要我们提出了一种新的方法，使用视频来获得高精度的对象建议弱监督对象检测。现有的弱监督...

"攻击引导感知数据生成用于真实世界再识别

215用于真实世界再识别的攻击引导感知数据生成Yukun Huang*Xueyang Fu*Zheng-JunZha†中国科学技术大学，中国kevinh@mail.ustc.edu.cn，{xyfu，zhazj} @ustc.edu.cn摘要在不受约束的现实世界监视场景中，个人重新...

基于部分小波相干和相位特征的步态识别方法及性能评估

Patel Institute of Technology，Shirpur，印度阿提奇莱因福奥文章历史记录：2017年5月1日收到2017年8月30日修订2017年9月18日接受2017年9月23日在线发布保留字：步态识别小波相干部分小波相干A B S T R A C T本文...

模型部署——RKNN模型量化精度分析及混合量化提高精度（附代码）

qq_40280673的博客

02-26

4340

由于在RKNN模型构建的过程中，对模型进行了量化，会无可避免的造成精度损失，使用精度分析接口，可以查看每一层的精度损失情况。通过混合量化，将某些损失较大的层，从量化层转为非量化层，从而提高模型的精度。

论文阅读：CENET: TOWARD CONCISE AND EFFICIENT LIDAR SEMANTIC SEGMENTATIONFOR AUTONOMOUS DRIVING

qq_53086461的博客

10-17

626

cenet

【论文阅读】Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey of Datasets and Methods

博客标题不能为空我也没办法

06-01

345

激光SLAM的综述，介绍了主流的方法以及常用的激光数据集

目前缺少用于语义分割的 3D LiDAR 数据吗？关于三维点云数据集和方法的调查

weixin_43823175的博客

03-04

1604

目前缺少用于语义分割的 3D LiDAR 数据吗？关于三维点云数据集和方法的调查原文 Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey of Datasets and Methods 论文地址 https://arxiv.org/abs/2006.04307 摘要 3D 语义分割是机器人和自动驾驶应用的一项基本任务。最近的工作主要集中在使用深度学习技术上，而开发精细注释的 3D LiDAR 数据集是极其劳动密集型的，并

HAQ：硬件感知的自动混合精度量化系统

u012347027的博客

12-13

2721

HAQ：硬件感知的自动混合精度量化系统摘要方法整体量化框架状态空间（Observation & State）卷积层全连接层动作空间（Action Space）量化方法奖赏函数（Reward Function）RL AgentQ-functionloss function实验结果面向边缘与云端的量化结果延时约束与能量约束下的量化结果模型大小约束下的量化结果本文是MIT韩松团队发表在 CVPR 2019 Oral 上的论文，本文提出了一种基于强化学习策略的自动化的量化框架，并将硬件架构包含在循环中，

利用Audio-driven TalkingFace HeadPose打造生动的音频驱动面部动画

最新发布

gitblog_00046的博客

04-13

412

利用Audio-driven TalkingFace HeadPose打造生动的音频驱动面部动画项目地址:https://gitcode.com/yiranran/Audio-driven-TalkingFace-HeadPose 本文将向您推荐一个令人惊叹的开源项目——Audio-driven TalkingFace HeadPose。这是一个基于深度学习的框架，能够实时地将语音转化为逼真的面...

HAWQ：基于 Hessian 的混合精度神经网络量化

u012347027的博客

11-28

3034

HAWQ：基于 Hessian 的混合精度神经网络量化摘要动机方法海森方法的有效性分析海森矩阵方法推导根据幂迭代求海森矩阵的最大特征值根据海森矩阵最大特征值确定量化精度与顺序实验结果ResNet20 On CIFAR-10ResNet50 on ImageNetSqueezeNext on ImageNetInception-V3 on ImageNet消融实验海森混合精度量化的有效性Block-Wise微调的有效性本文为 UC Berkeley 大学发表在 ICCV 2019上的混合精度量化论文。旨在

Quantization｜A White Paper on Neural Network Quantization (谷歌量化白皮书)

weixin_44935658的博客

06-17

1510

记一下谷歌量化白皮书的理解。按原文目录分

ICCV 2021 | FACIAL ：动态谈话人脸视频生成，姿态，眨眼皆可控！

3D视觉工坊

09-03

2083

来源：AI科技评论本文是对发表于计算机视觉领域的顶级会议 ICCV 2021的论文“FACIAL: Synthesizing Dynamic Talking Face with Impli...

模式识别的理论与应用：新进展与未来趋势

“模式识别研究进展-刘成林and谭铁牛，主要探讨了模式识别的历史、核心问题、方法进展及未来趋势，涉及概率密度估计、特征选择与变换、分类器设计等领域。” 模式识别，作为人工智能的重要组成部分，自20世纪60年代...

学术速递4 | 谷歌混合精度量化 | 清华语音人脸视频生成 | 谭铁牛步态识别对抗攻击 | 北大点云数据

​几篇近期的paper：

1. 清华：音频驱动的具有自然头部姿势的语音人脸视频生成

几篇近期的paper：