![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
史上最详细
文章平均质量分 90
本专栏包含史上最详细系列的文章
想到好名再改
研究方向:计算机幻觉
展开
-
超优化文章记录之NeurIPS2022_Gradient Descent: The Ultimate Optimizer
关于超优化文章Gradient Descent: The Ultimate Optimizer的文章记录,审稿评价,代码解读,实验验证的博客。改文章获得2022NeurIPS最佳论文奖。原创 2023-01-10 22:21:02 · 828 阅读 · 2 评论 -
史上最详细Multi-grained Spatio-Temporal Features Perceived Network for Event-based Lip-Reading文章记录
本文为Multi-Grained Spatio-Temporal Features Perceived Network for Event-Based Lip-Reading的记录原创 2022-08-10 21:15:17 · 917 阅读 · 2 评论 -
史上最详细Synchronous Bidirectional Learning for Multilingual Lip Reading文章记录
本文为Synchronous Bidirectional Learning for Multilingual Lip Reading的记录原创 2022-01-23 15:32:04 · 3276 阅读 · 2 评论 -
史上最详细Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention文章记录
本文为Automatic Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention for Image Sequences with No Word Boundaries的记录,原论文请看https://pan.baidu.com/s/1eLfUdcAfGYf5k31JOSdf9w,提取码:1111。来源:INTERSPEECH2021作者单位:中国科学技术大学文章目录1.翻译原文1.1摘要1.2介绍1.3提出的方法1原创 2021-12-29 21:31:50 · 1097 阅读 · 2 评论 -
史上最详细唇语识别最新研究进展记录
本文是唇语识别近2年来最新的方法的记录,主要集中在中英文词级数据集如LRW,LRW-1000,英文句子级数据集如LRS2,英文短语级数据集如OuluVS2,以及其他一些数据集。记录方法为1.翻译原文;2.总结文章内容;3.介绍相关文章。记录将持续更新,对唇语识别感兴趣的研究者请收藏或私信交流,本文将持续更新。待记录的文章列表(持续更新):1.Learn an Effective Lip Reading Model without Pains2.Lipreading using Temporal C原创 2021-12-27 17:38:59 · 2225 阅读 · 3 评论 -
史上最详细How to Use Time Information Effectively Combining with Time Shift Module for Lipreading文章记录
本文为How to Use Time Information Effectively Combining with Time Shift Module for Lipreading的记录,原论文请看百度云链接,提取码:1111。来源:ICASSP2021作者单位:新疆大学文章目录1.翻译原文1.1摘要1.2介绍1.3相关工作1.4提出的方法1.5实验1.6结论2.介绍相关文章1.翻译原文1.1摘要1.唇读是xxxx的任务。2.现在的模型基于单层3D(时空)核多层2D(空间)提取时空特征。3.原创 2021-12-27 17:23:58 · 754 阅读 · 0 评论 -
史上最详细Lipreading using Temporal Convolutional Networks(MS-TCN)代码层面详解
本文将从代码层面详细介绍在LRW数据集实现SOTA效果的唇语识别模型MS-TCN。GitHub代码请看Lipreading using Temporal Convolutional Networks,环境配置请看史上最详细 Lipreading using Temporal Convolutional Networks 环境配置,使用的数据集请看史上最详细唇语识别数据集综述和史上最详细LRW数据集、LRW-1000数据集、LRS2数据集和OuluVS2数据集介绍。下面开始正文,本文将以一个mini bat原创 2021-10-08 01:03:34 · 3465 阅读 · 49 评论 -
史上最详细LRW数据集、LRW-1000数据集、LRS2数据集、LRS3-TED数据集、OuluVS2数据集介绍
本文将介绍唇语识别领域使用最多的三个数据集。本文只包含简略信息,如想了解更详细的信息请在评论区补充,博主将在文章中更新。一、LRW如图所示,格式为标准的分类任务数据集。LRW/LRW/EXAMPLE/LRW/EXAMPLE/test/LRW/EXAMPLE/test/EXAMPLE_00001.txt二、LRW-1000(没在本地下,只展示百度云文件)LRW-1000/LRW-1000/Data_Annotation.txtLRW-1000/audioLRW-1000/原创 2021-08-09 18:01:00 · 23299 阅读 · 263 评论 -
史上最详细 Lipreading using Temporal Convolutional Networks 环境配置
唇语识别是目前人工智能领域比较热门的应用之一,本文将在之后的内容中介绍2020年英文词汇级唇语识别在LRW(Lir Reading in the Wild)数据集以及LRW-1000两个数据集上实现SOTA的项目github,下面是论文地址Lipreading using Temporal Convolutional Networks文章目录0.介绍1.下载项目源代码2.环境配置1.pytorch2.其他库3.模型下载4.数据集准备5.进行测试0.介绍该项目中实现唇语识别的过程主要步骤将人原创 2020-11-03 16:45:24 · 6311 阅读 · 121 评论 -
史上最详细唇语识别数据集综述
唇语识别数据集综述原创 2020-09-01 15:58:57 · 21508 阅读 · 50 评论 -
史上最详细yolov5环境配置搭建+配置所需文件
yolov5的配置过程总体来说还算简单,但是网上大部分博客都没有仔细介绍具体步骤,本文将从最细节的层面记录yolov5环境配置的全过程使用到的工具有1.anaconda,pycharm2.cuda10.2+cudnn-10.2-windows10-x64-v7.6.5.32+pytorch1.5.1+。。。。。。。。ps(pytorch只要大于等于1.5.1即可,本文将在之后说明安装步骤)所需资源:本博客免费提供所有win10的cuda和cudnn,百度云,提取码:elpt以及权重文件百度云,原创 2020-07-31 00:21:49 · 193613 阅读 · 613 评论