自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (4)
  • 收藏
  • 关注

原创 IEEE Transactions on Geoscience and Remote Sensing(IEEE TGRS)中深度学习相关文章及研究方向总结

本文旨在调研TGRS中所有与深度学习相关的文章,以投稿为导向,总结其研究方向规律等。文章来源为EI检索记录,选取2020到2023年期间录用的所有文章,约4000条记录。同时,考虑到可能有会议转投期刊,模型改进转投或相关较强等情况,本文也添加了这些文章。

2023-04-08 20:19:43 5173 2

原创 超优化文章记录之NeurIPS2022_Gradient Descent: The Ultimate Optimizer

关于超优化文章Gradient Descent: The Ultimate Optimizer的文章记录,审稿评价,代码解读,实验验证的博客。改文章获得2022NeurIPS最佳论文奖。

2023-01-10 22:21:02 808 2

原创 史上最详细Multi-grained Spatio-Temporal Features Perceived Network for Event-based Lip-Reading文章记录

本文为Multi-Grained Spatio-Temporal Features Perceived Network for Event-Based Lip-Reading的记录

2022-08-10 21:15:17 882 2

原创 史上最详细Synchronous Bidirectional Learning for Multilingual Lip Reading文章记录

本文为Synchronous Bidirectional Learning for Multilingual Lip Reading的记录

2022-01-23 15:32:04 3262 2

原创 史上最详细Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention文章记录

本文为Automatic Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention for Image Sequences with No Word Boundaries的记录,原论文请看https://pan.baidu.com/s/1eLfUdcAfGYf5k31JOSdf9w,提取码:1111。来源:INTERSPEECH2021作者单位:中国科学技术大学文章目录1.翻译原文1.1摘要1.2介绍1.3提出的方法1

2021-12-29 21:31:50 1052 2

原创 史上最详细唇语识别最新研究进展记录

本文是唇语识别近2年来最新的方法的记录,主要集中在中英文词级数据集如LRW,LRW-1000,英文句子级数据集如LRS2,英文短语级数据集如OuluVS2,以及其他一些数据集。记录方法为1.翻译原文;2.总结文章内容;3.介绍相关文章。记录将持续更新,对唇语识别感兴趣的研究者请收藏或私信交流,本文将持续更新。待记录的文章列表(持续更新):1.Learn an Effective Lip Reading Model without Pains2.Lipreading using Temporal C

2021-12-27 17:38:59 2061 3

原创 史上最详细How to Use Time Information Effectively Combining with Time Shift Module for Lipreading文章记录

本文为How to Use Time Information Effectively Combining with Time Shift Module for Lipreading的记录,原论文请看百度云链接,提取码:1111。来源:ICASSP2021作者单位:新疆大学文章目录1.翻译原文1.1摘要1.2介绍1.3相关工作1.4提出的方法1.5实验1.6结论2.介绍相关文章1.翻译原文1.1摘要1.唇读是xxxx的任务。2.现在的模型基于单层3D(时空)核多层2D(空间)提取时空特征。3.

2021-12-27 17:23:58 714

原创 史上最详细Lipreading using Temporal Convolutional Networks(MS-TCN)代码层面详解

本文将从代码层面详细介绍在LRW数据集实现SOTA效果的唇语识别模型MS-TCN。GitHub代码请看Lipreading using Temporal Convolutional Networks,环境配置请看史上最详细 Lipreading using Temporal Convolutional Networks 环境配置,使用的数据集请看史上最详细唇语识别数据集综述和史上最详细LRW数据集、LRW-1000数据集、LRS2数据集和OuluVS2数据集介绍。下面开始正文,本文将以一个mini bat

2021-10-08 01:03:34 3306 49

原创 史上最详细LRW数据集、LRW-1000数据集、LRS2数据集、LRS3-TED数据集、OuluVS2数据集介绍

本文将介绍唇语识别领域使用最多的三个数据集。本文只包含简略信息,如想了解更详细的信息请在评论区补充,博主将在文章中更新。一、LRW如图所示,格式为标准的分类任务数据集。LRW/LRW/EXAMPLE/LRW/EXAMPLE/test/LRW/EXAMPLE/test/EXAMPLE_00001.txt二、LRW-1000(没在本地下,只展示百度云文件)LRW-1000/LRW-1000/Data_Annotation.txtLRW-1000/audioLRW-1000/

2021-08-09 18:01:00 21754 259

原创 史上最详细 Lipreading using Temporal Convolutional Networks 环境配置

唇语识别是目前人工智能领域比较热门的应用之一,本文将在之后的内容中介绍2020年英文词汇级唇语识别在LRW(Lir Reading in the Wild)数据集以及LRW-1000两个数据集上实现SOTA的项目github,下面是论文地址Lipreading using Temporal Convolutional Networks文章目录0.介绍1.下载项目源代码2.环境配置1.pytorch2.其他库3.模型下载4.数据集准备5.进行测试0.介绍该项目中实现唇语识别的过程主要步骤将人

2020-11-03 16:45:24 6016 121

原创 史上最详细唇语识别数据集综述

唇语识别数据集综述

2020-09-01 15:58:57 20404 50

原创 史上最详细yolov5环境配置搭建+配置所需文件

yolov5的配置过程总体来说还算简单,但是网上大部分博客都没有仔细介绍具体步骤,本文将从最细节的层面记录yolov5环境配置的全过程使用到的工具有1.anaconda,pycharm2.cuda10.2+cudnn-10.2-windows10-x64-v7.6.5.32+pytorch1.5.1+。。。。。。。。ps(pytorch只要大于等于1.5.1即可,本文将在之后说明安装步骤)所需资源:本博客免费提供所有win10的cuda和cudnn,百度云,提取码:elpt以及权重文件百度云,

2020-07-31 00:21:49 182949 607

原创 IEEE Transactions on Geoscience and Remote Sensing(IEEE TGRS)文章检索脚本(适用于所有xplore检索导出)

本文为IEEE TGRS使用xplore导出检索记录的批处理脚本,导出为pdf格式方便阅读,此处给出。xplore导出的csv文件格式如下。

2023-04-08 20:44:42 991

原创 SAR成像-BP后向投影算法及GPU加速

并在其基础上增加更多注释和可视化图,并改写了GPU加速代码,经测试提速约为50倍。此文为SAR BP成像matlab实现,主要参考。雷达延X轴运动,目标为Y轴上的一个点。表示其中某一个时刻的中频。

2023-03-25 18:43:16 1414 5

原创 二叉排序树查找成功时的平均查找长度公式及证明

二叉排序树是基于二分查找步骤生成的二叉树。设二叉排序树的高度为h,共有n个结点有如下性质:1.前h-1层结点全部占满(即为满二叉树)2.最后一层结点可以通过平移使得整个树转化成完全二叉树思路:首先求前h-1层的对比次数之后求最后一层的对比次数公式为:下面给出证明过程:...

2020-07-28 14:58:23 4203

原创 SFML环境配置

材料:1.visual studio 20172.SFML-2.5.1-windows-vc15-32-bit准备阶段1.进入SFML官网下载sfml-vs2017-32bit版本2.将该压缩包解压在一个文件夹中步骤:1.进入vs,在上述文件夹中新建Empty Project,右键资源文件->添加->新建项->c++文件,输入此代码测试基础配置是否完成#include<iostream>using namespace std;int main() { c

2020-05-11 01:06:53 5304 19

IEEE TGRS近三年文章检索记录

本资源选取2020到2023年期间IEEE TGRS录用的所有文章,约4000条记录,以文章标题+摘要的形式批处理为pdf文档方便阅读,并按时间划分为12份

2023-04-08

coco2017数据集--训练集的xml标注文件

此文件是使用coco2017的训练集的原json标注格式转化为xml文件标注格式的所有图片的标注,共118287个xml文件

2020-09-11

coco2017数据集--训练集的txt标注文件,适用于yolov5训练

此文件是使用coco2017的训练集的原json标注格式转化为xml文件标注格式再转化为txt标注格式的所有图片的标注,共118287个txt文件

2020-09-11

数据结构实验.rar

此为河北工业大学数据结构课程全部的实验报告,得分为95分,包括实验1,实验2,实验3,实验4,实验5,实验6,6 个实验

2020-08-28

顺序表和链表的基本操作和实际应用

此为线性表应用实例代码集合,包括顺序表和链表的各种基本操作、以及顺序表链表在多项式和图书管理系统中的应用

2020-07-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除