自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (6)
  • 收藏
  • 关注

原创 深度学习论文写作框架

0. 前言一篇好论文的几个评价标准:Significance(重要性)、Novelty(创新性)、Presentation(表达能力)、Experiments(实验结果)论文结构应为金字塔结构,层层递进,逐次展开。塔尖即论文标题,总领全篇;塔顶即论文摘要,高屋建瓴;塔身即论文简介,全面介绍;塔底即方法、实验方法、实验结果等,详细说明。在具体写作过程中,每一段应遵循总——分结构,即段首概况段意,段身详述内容如无特殊要求,论文时态多为一般现在时态1. Abstract写作2. Introduct

2021-09-19 16:07:20 6725

原创 深度学习框架Pytorch

基本数据类型数据类型pythonPyTorchIntIntTensor of size()floatFloatTensor of size()Int arrayIntTensor of size [d1, d2…]Float arrayFloatTensor of size [d1, d2,…]string–CPU tensorGPU tensortorch. FloatTensortorch. cuda . FloatT

2020-08-17 10:18:44 743

原创 Python机器学习基础

本文主要为中国大学MOOC(Python机器学习应用 北京理工大学)学习笔记,部分内容参考周志华《机器学习》、麦子学院机器学习入门课程

2020-07-17 11:05:49 997

原创 Python入门深度学习

一、感知机一个感知器有如下组成部分:输入权值 一个感知器可以接收多个输入,每个输入上有一个权值wi此外还有一个偏置项b,就是上图中的w0。激活函数 感知器的激活函数可以有很多选择,比如我们可以选择下面这个阶跃函数来作为激活函数:输出 感知器的输出由下面这个公式来计算感知机基础实现代码:#定义感知机类class Perceptron(object): #初始化感知机,设初值为0 def __init__(self, input_num, activator):

2020-07-05 15:49:37 852 1

原创 实现中文唇语识别的多种途径

唇语识别技术指的是获取人在说话时其嘴唇的动态变化等信息并进行分析,然后识别出该人在说唇语时所要表达的内容。人类对语言的认知一般都需要多方面的感知,所以人们在进行交流时不仅仅只通过听觉来进行理解交流内容,通常还需要其他的辅助方式来进行交谈例如通过嘴唇的动态变化或者脸部表情等视觉信息方式。随着人工智能使用越来越多,例如识别图像特征等方面在近几年发展较快。唇语识别中技术涉及广泛,例如主要有计算机视觉、模式识别、机器学习、图像处理以及人机交互等方面的技术。

2020-01-13 21:58:50 13005 11

原创 Python数据分析与展示

本文是基于《利用python进行数据分析(第二版)》全书及中国大学MOOC(北京理工大学)相关课程总结的学习笔记

2019-10-05 22:54:36 1236

原创 算法竞赛入门(C++)

C++版算法竞赛入门笔记

2019-07-06 19:05:27 2045 2

转载 医学图像中的GAN汇总

Awesome GAN for Medical ImagingA curated list of awesome GAN resources in medical imaging, inspired by the other awesome-* initiatives.For a complete list of GANs in general computer vision, please visit really-awesome-gan.To complement or correct it, p

2021-07-30 10:03:06 1774

转载 AcWing蓝桥杯题集

第一讲 递归与递推例题92. 递归实现指数型枚举93. 递归实现组合型枚举94. 递归实现排列型枚举717. 简单斐波那契95. 费解的开关习题1209. 带分数116. 飞行员兄弟1208. 翻硬币

2021-01-12 21:17:18 2749 1

原创 时间卷积网络(TCN)在唇语识别中的应用

本文对2020年TCN在唇语识别技术进行了跟踪和描述

2020-12-26 10:38:20 2399

原创 计算机医学图像数据集汇总

一、肺结节数据集计算机辅助诊断(CAD)主要是指基于医学影像学的计算机辅助技术。CAD 被视为医生的“第三只眼”,其广泛应用有助于提高诊断的敏感性和特异性。近年来,基于深度学习技术基础并利用海量医学影像数据的完备性优势,使得临床诊断精度得到很大的提高。本文针对肺节结数据集、乳腺 MG 数据集等进行介绍,文中列出的一些常用的不同类型医学影像数据库地址链接包括:①http://www.cancerimagingarchive.net②https://grand-challenge.org③https:/

2020-09-07 09:39:56 3169

原创 读科研论文的三个层次、四个阶段与十个问题

本文为《沈向洋、华刚:读科研论文的三个层次、四个阶段与十个问题》笔记

2020-08-05 10:09:02 1570

原创 Python Selenium预约驾校系统

以下代码专用于特定驾校系统预约,无普适性,了解Selenium功能详情参考链接from selenium import webdriverfrom selenium.webdriver.common.keys import Keysimport oschromedriver = "chromedriver.exe"os.environ["webdriver.chrome.driver"] = chromedriverbrowser = webdriver.Chrome(chromedriver)

2020-07-06 17:29:10 1000 1

原创 Codeforces Global Round 7

A. Bad Ugly Numbers题意:给定一个数的位数,要求输出该数满足:该数不是各个位上数字的倍数思路:又是一道投机题,不能采用常规的方法。除各位数外,一个有意思的数“233…”正好满足题目要求代码:#include<iostream>using namespace std;int T;int x ;int main(){ cin >...

2020-03-20 09:59:54 594

原创 棋盘问题(POJ 1321)

在一个给定形状的棋盘(形状可能是不规则的)上面摆放棋子,棋子没有区别。要求摆放时任意的两个棋子不能放在棋盘中的同一行或者同一列,请编程求解对于给定形状和大小的棋盘,摆放 k 个棋子的所有可行的摆放方案数目 C。输入格式输入含有多组测试数据。每组数据的第一行是两个正整数 n,k,用一个空格隔开,表示了将在一个 n∗n 的矩阵内描述棋盘,以及摆放棋子的数目。当为-1 -1时表示输入结束。随后...

2020-03-16 20:20:57 642

原创 Educational Codeforces Round 83 (Rated for Div. 2)

A. Two Regular Polygons思路:题目给出正多变形的边数,要求判断后者能否内接前者;实质是图形的内接条件,对应角成比例可以转化为对应边成比例,即判断前者是否为后者的倍数即可;代码:#include<iostream>using namespace std;int main(){ int n,m,k; cin>>k; while(k-...

2020-03-14 20:35:02 606

原创 Codeforces Round #626 (Div. 2)

A 、Even Subset Sum Problem思路:题目要求判断子集是否能构成偶数,满足存在偶数或至少两个奇数即可;最后输出前1~2个数,而非随意输出;原代码:#include<iostream>using namespace std;const int N = 105;int arr[N];int n,m;int main(){ cin >&g...

2020-03-14 20:24:15 678

原创 约数之和

假设现在有两个自然数A和B,S是AB的所有约数之和。请你求出S mod 9901的值是多少。输入格式在一行中输入用空格隔开的两个整数A和B。输出格式输出一个整数,代表S mod 9901的值。数据范围0≤A,B≤5×107输入样例:2 3输出样例:15注意: A和B不会同时为0。思路:数学知识是关键质因数分解,就是将一个数分解成为 p1c1 ×p2c2×…...

2020-03-04 22:18:01 715

原创 奇怪的汉诺塔

汉诺塔问题,条件如下:1、这里有A、B、C和D四座塔。2、这里有n个圆盘,n的数量是恒定的。3、每个圆盘的尺寸都不相同。4、所有的圆盘在开始时都堆叠在塔A上,且圆盘尺寸从塔顶到塔底逐渐增大。5、我们需要将所有的圆盘都从塔A转移到塔D上。6、每次可以移动一个圆盘,当塔为空塔或者塔顶圆盘尺寸大于被移动圆盘时,可将圆盘移至这座塔上。请你求出将所有圆盘从塔A移动到塔D,所需的最小移动次数是多...

2020-03-04 19:18:54 918

原创 费解的开关

你玩过“拉灯”游戏吗?25盏灯排成一个5x5的方形。每一个灯都有一个开关,游戏者可以改变它的状态。每一步,游戏者可以改变某一个灯的状态。游戏者改变一个灯的状态会产生连锁反应:和这个灯上下左右相邻的灯也要相应地改变其状态。我们用数字“1”表示一盏开着的灯,用数字“0”表示关着的灯。下面这种状态1011101101101111000011011在改变了最左上角的灯的状态后将变成:...

2020-03-03 20:56:16 704

原创 《算法竞赛进阶指南》题集

一、基本算法(一)位运算1.a^b2.64位整数乘法3.最短Hamilton路径(二)递推与递归1.递归实现指数型枚举2.递归实现组合型枚举3.递归实现排列型枚举...

2020-03-02 22:06:10 1009

原创 递归实现排列型枚举

把 1~n 这 n 个整数排成一行后随机打乱顺序,输出所有可能的次序。输入格式一个整数n。输出格式按照从小到大的顺序输出所有方案,每行1个。首先,同一行相邻两个数用一个空格隔开。其次,对于两个不同的行,对应下标的数一一比较,字典序较小的排在前面。数据范围1≤n≤9输入样例:3输出样例:1 2 31 3 22 1 32 3 13 1 23 2 1思路:...

2020-03-02 21:58:42 664

原创 递归实现组合型枚举

从 1~n 这 n 个整数中随机选出 m 个,输出所有可能的选择方案。输入格式两个整数 n,m ,在同一行用空格隔开。输出格式按照从小到大的顺序输出所有方案,每行1个。首先,同一行内的数升序排列,相邻两个数用一个空格隔开。其次,对于两个不同的行,对应下标的数一一比较,字典序较小的排在前面(例如1 3 5 7排在1 3 6 8前面)。数据范围n>0 ,0≤m≤n ,n+(n...

2020-03-02 21:31:40 690

原创 递归实现指数型枚举

从 1~n 这 n 个整数中随机选取任意多个,输出所有可能的选择方案。输入格式输入一个整数n。输出格式每行输出一种方案。同一行内的数必须升序排列,相邻两个数用恰好1个空格隔开。对于没有选任何数的方案,输出空行。本题有自定义校验器(SPJ),各行(不同方案)之间的顺序任意。数据范围1≤n≤15输入样例:3输出样例:322 311 31 21 2 3思路...

2020-03-02 19:47:24 691

原创 最短Hamilton路径

给定一张 n 个点的带权无向图,点从 0~n-1 标号,求起点 0 到终点 n-1 的最短Hamilton路径。 Hamilton路径的定义是从 0 到 n-1 不重不漏地经过每个点恰好一次。输入格式第一行输入整数n。接下来n行每行n个整数,其中第i行第j个整数表示点i到j的距离(记为a[i,j])。对于任意的x,y,z,数据保证 a[x,x]=0,a[x,y]=a[y,x] 并且 a[x...

2020-02-21 09:10:52 678

原创 64位整数乘法

求 a 乘 b 对 p 取模的值。输入格式第一行输入整数a,第二行输入整数b,第三行输入整数p。输出格式输出一个整数,表示a*b mod p的值。数据范围1≤a,b,p≤1018输入样例:345输出样例:2思路:参考 a^b题(此题的唯一区别在于实质上是加分运算,a^b是乘法运算)代码:#include<iostream>using na...

2020-02-20 19:17:49 649

原创 a^b

《算法竞赛进阶指南》 — 基本算法 — 位运算

2020-02-20 19:07:48 681

原创 统计学习方法——隐马尔可夫模型(HMM)

隐马尔可夫模型(HMM)广泛应用于科学研究与工程技术的多个领域,尤其在自然语言处理中占有十分重要的地位,其所适用的范围涵盖了分词、词性标注、语音识别等多个方面。(一)HMM简介...

2020-01-15 18:39:06 1030

原创 图像特征——Haar-like 特征

目前常用的 Haar-like 特征主要包含四类:边缘特征、线性特征、中心特征以及对角线特征(也称特定方向特征),特征模板则由上述四类特征组合而成,如图所示:特征模板实质上就是一个矩形,该矩形被划分为 2-3 个区域,每个区域使用黑色或白色填充。每个模板对应一个特征值,该值是由两种颜色覆盖区域内各自像素值总和做差得到的。通过该特征值的计算方式不难发现,Haar-like 特征其实可以被看做是图...

2020-01-14 21:26:44 2157

原创 统计学习方法——AdaBoost算法

提升(boosting) 方法是一种常用的统计学习方法,应用广泛且有效.在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能.

2020-01-14 18:19:06 753

原创 数据结构基础(ZJU_C版)

一、基本概念二、线性结构三、树四、图五、排序六、散列查找

2020-01-14 17:13:25 694

原创 Windows Sever 2016

1.Introduction to File and Storage Services in Windows Server 2016Introduction to files and storage solutions1.Command line:everything that you can do in a graphical user interface can also be done in...

2019-03-30 09:53:39 853

基于视觉信息和深度学习的中文唇语数据集构建与识别_胡扬.caj

本文以中文唇语识别为主线,通过更有效的数据收集手段将中文的唇语识别问 题拓展到更一般更现实的中文环境中,并通过深度学习技术有效解决现实环境下变 长唇语序列图片的中文识别问题。本文的主要研究内容包括: 1. 研究以互联网视频为数据源头,自动快速构建中文唇语数据集的方法。互联 网视频中的场景变化较多,与现实环境相符,同时资源获取成本较低,本文 基于此,提出有效的从互联网视频中获取可以用于训练唇读模型的唇部序列 图片和对应的中文内容。 2. 研究中文唇语识别的网络设计。相较于限定实验环境下的唇语识别,现实环 境下的中文唇语识别语料过于丰富,同时语句长度不定,为了解决这两个难 题,本文以深度学习为背景技术,进行端到端的中文唇语识别网络设计,来 针对变长中文唇语识别问题。

2020-04-27

基于深度学习的唇语识别研究_吴伟(好).caj

本文在深度学习技术基础上对唇语进行识别研究,其具体流程及章节安排 如下: 1. 主要介绍了唇语识别技术的相关内容,给出了传统的唇语识别方法与基 于深度学习的唇语识别方法的区别与联系,并针对国内外研究状况进行了分析 介绍。 2. 对唇语识别技术的一些相关理论技术进行了介绍,并且利用唇语识别研 究中的人脸检测,唇部定位,视觉特征和时序特征的提取以及最后的唇动识别 这几个方面来展开介绍,同时也介绍了深度学习方面相关模型与算法。 3. 首先对唇语识别的实现过程做了简要叙述;其次,通过检测人脸与脸部 关键点来对唇部进行检测做了详细介绍;最后,介绍了通过手工设计特征 HOG 特征以及采用 LSTM 网络来对唇语进行识别,并在公开的 GRID 数据集上进行 验证。

2020-04-27

基于深度学习的唇语识别数据库构建和算法研究_杨明敏(好).caj

本文的研究内容主要包括数据库构建和算法研究两个方面,主要内容如下: (1)中文唇语识别数据集 LRW-1000 的构建:考虑到目前关于中文唇语识别的 研究尚无一个基准的数据库,为了给未来中文唇语识别的研究提供一个数据基准, 本课题根据自采的数据,与中科院计算所 VIPL 组合作构建了一个大型的开放场景下 中文唇语识别数据集,并提出了一个完整的构建流程,详细介绍了构建流程中的设 计到的算法原理。 (2)唇语识别算法:提出了一个新的唇语识别算法,来学习从唇语图像序列到 目标文本序列的映射。为了增强网络对短时依赖的建模能力,结合 DenseNet 和时空卷积提出一个新的网络结构,命名为 D3D。然后使用循环神经网络对得到特征的时 序关联进行学习。同时,针对特定的网络结构,设计了一个三段式的训练方法来解 决模型收敛不稳定的问题,该训练方式对于模型性能有显著提升。

2020-04-27

基于HMM与深度学习的唇读识别研究_宋文明(好).caj

尽管国内的唇语识别研究工作已经开展了一段时间,但统一的、标准的用于汉语唇 语识别的语料库还没有建立起来,也没有权威机构提出该方面的建议。因此,本文提出了自己的一套汉语识别的语料架构用于本文涉及到的实验,并在此基础上提出改进方案 以使其适用范围更广。 隐马尔可夫模型的双随机过程与人类语言表达相吻合,这一特点使得该方法成为最 适合唇语识别的方法。本文将对 HMM 方法做深入研究,探究其在唇语识当中的具体适用形式,包括参数设置、模型的类型选择以及训练方法等。

2020-04-27

基于深度学习的唇语识别应用的研究与实现_杨帆(好).caj

唇语识别是计算机视觉领域中一个富有挑战性的研究课题,其主要目的是从 视频中观察人嘴唇运动识别出对应文本内容。然而,由于嘴唇变化局限性和语言 内容丰富性,增加唇语识别难度,使得唇语研究课题发展缓慢。如今,深度学习 在各个领域的发展,给我们足够的信心来完成唇语识别这个任务。不同于传统的 唇语识别中的嘴唇特征识别,在基于深度学习的唇语识别,通常包含使用深度网 络模型对图像的特征提取和理解。

2020-01-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除