- 博客(45)
- 资源 (44)
- 收藏
- 关注
原创 关于音频降噪
常见的音频降噪算法,对于加性平稳随机噪声,效果还是很不错的,加性平稳随机噪声的假设是很多语音增强的假设前提。关于非平稳噪声,比如,发动机的轰鸣声、风声、街道上别人的声音,就需要根据场景来处理,要单独处理。
2016-05-31 11:31:03 4068
转载 通过命令的方式实现计算机定时关机
http://jingyan.baidu.com/article/59a015e3872228f7948865c8.html
2016-05-27 18:10:34 383
原创 opencv编译contrib部分
1 先在官网下载opencv2 在网址:https://github.com/Itseez/opencv_contrib下载contrib部分的代码3 下载cmake gui:http://www.cmake.org/cmake/resources/software.html然后按照以下步骤进行:打开cmake-gui在where is the source cod
2016-05-27 17:24:00 1461
原创 vector的初始化问题
vector也是可以初始化的,可以指定初始的长度和初始的值vector rho(nSamples, 0);nSamples是初始的长度,0是初始的值
2016-05-27 15:14:57 595
原创 朴素贝叶斯
朴素贝叶斯的核心在于样本的每个特征属性之间是假定不相关的 所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关:例如,如果一种水果其具有红,圆,直径大概3英寸等特征,该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属性在判定该水果是否为苹果的概率分布上独立。 对于某些类型的概率模型,在监督式学习集中能获取得非
2016-05-27 11:29:00 420
原创 最大似然估计
说的通俗一点啊,最大似然估计,就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值。例如:一个麻袋里有白球与黑球,但是我不知道它们之间的比例,那我就有放回的抽取10次,结果我发现我抽到了8次黑球2次白球,我要求最有可能的黑白球之间的比例时,就采取最大似然估计法: 我假设我抽到黑球的概率为p,那得出8次黑球2次白球这个结果的概率为:P(黑=8)=p^8*(1-p)^2
2016-05-27 10:44:02 723
原创 C++纯虚函数
在C++中如果在一个函数的声明中加上virtual ,并且降这个函数赋值为0,那么证明这个函数是纯虚函数,函数的特点如下:1 该函数在声明的地方不能够对其进行定义,即,不能够给出其具体的实现2 该函数在其继承的函数中必须要实现,即,要给出其具体的实现3 该函数所在的类不能够创建对象(即,不能够实例化),但是可以声明指针
2016-05-27 10:40:17 378
原创 函数参数名后面加const的意义
const int* i=0; 代表i是常量,里面的值不能够变int* const i=; 代表指针i是常量,所指的内容可以修改const对象只能调用const成员函数(所谓const成员函数,是指在函数的参数括号后面添加const的函数,比如int a(int i) const{})。 const对象的值不能被修改,在const成员函数中修改
2016-05-27 10:38:56 5948
原创 类声明和定义中const、inline、默认参数、explicit、static、virtual的出现频率
1 在类申明中,在形参表之后添加关键字const,使成员函数变成常量(我们可以理解为将this指定指定为常量),如此便不能通过成员函数来修改对象的数据成员,无论是共有的还是私有的。例如double avg_price() const;该函数avg_price()不能更改对象的任何数据成员。需要强调一点的是:const关键字必须同时出现在类的申明和定义中,若只出现一次,将会报错。2 如果类的
2016-05-27 10:37:46 633 1
原创 SVM中遇到的非均衡数据集
对于SVM中遇到的非均衡数据集,可以采用以下策略:假设有4类样本,比如,第一类有500个,第二类有300个,第三类有600个,第四类有200个,那么,可以通过SVM的class_weights(CvSVM中有该参数)来进行均衡,具体如下,1 求所有样本和,在这里为16002 求每一类样本数与总数的比值,如在这里为 500/1600=0.3125, 300
2016-05-27 10:36:42 3294 1
转载 libsvm 训练后的模型参数讲解
本帖子主要就是讲解利用libsvm-mat工具箱建立分类回归模型后得到的模型model里面参数的意义都是神马以及如果通过model得到相应模型的表达式这里主要以分类问题为例子。 测试数据使用的是libsvm-mat自带的heart_scale.mat数据270*13的一个属性据矩阵共有270个样本每个样本有13个属性方便大家自己测试学习。 首先上
2016-05-27 10:35:16 3240
原创 40个图像处理开源库
40个图像处理开源库:Face Recognition - 拉姆达实验室斯蒂芬弄的。示例代码和图形演示点击http://api.lambdal.com/docs,我们的API提供了面部识别,面部检测,眼睛定位,鼻子定位,嘴巴定位,和性别分类。如果您有任何疑问,只需发一封邮件到[email protected]。Face (Detection) - 计算机视觉面部识别和面部检测。这是一个完
2016-05-27 10:31:24 4256
原创 变量存储区
静态存储区: 全局,静态变量之类的都在静态存储区域分配栈: 执行函数时,函数内部局部变量的存储单元在栈上创建,函数执行完时自动释放堆: 堆上分配也叫动态内存分配,程序在运行的时候用malloc或new申请
2016-05-27 10:29:59 401
原创 VS筛选器
使用vs2010开发项目时,有时源码文件过多,想按功能进行分类管理,这个时候就可以使用“筛选器(filter)”。 添加筛选器很简单,在项目上右键单击,选择“添加 | 新建筛选器”,然后命名就可以了。之后向筛选器中添加文件。创建筛选器之后,要注意工程目录下的“*.filters”文件一定不能删掉,因为这个文件就是用来记录筛选器的。 还有一个问题就是,有
2016-05-27 10:28:33 2216 1
原创 explicit构造函数
关键字explicit,可以阻止不应该允许的经过转换构造函数进行的隐式转换的发生。声明为explicit的构造函数不能在隐式转换中使用。 C++中, 一个参数的构造函数(或者除了第一个参数外其余参数都有默认值的多参构造函数), 承担了两个角色。 1 是个构造器 2 是个默认且隐含的类型转换操作符。 所以, 有时候在我们写下如 AAA = XXX, 这样的代码, 且恰好XXX的类
2016-05-27 10:19:19 391
原创 extern "C"的用法解析
extern "C"的用法解析 (1 extern C修饰,1是指全局变量;)(2是指被extern "C"修饰的变量和函数是按照C语言方式编译和连接的)1.引言 C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言,C++保留了一部分过程式语言的特点(被世人
2016-05-27 10:18:28 696
原创 数据结构中的堆栈和内存中的堆栈
数据结构中的堆栈: 1 都是一种数据按序排列的数据结构,只能在一端对数据进行插入和删除 2 堆:队列优先,先进先出;栈,先进后出内存分配中的堆栈,在C++中内存分成5个区,分别是堆、栈、自由存储区、全局/静态存储区、常量存储区。 1 栈,就是那些有编译器在需要的时候分配,在不需要的时候自动清除的变量存储区。里面的变量基本上是局部变量、函数参数等,栈由系统自
2016-05-27 10:17:48 687
原创 C++中vector删除指定位置的元素
1、可以用erase方法删除vector指定位置的元素。2、例程:#include #include using namespace std;int main(int argc, char** argv){ std::vector vec; for(int i=0;i printf("10:%d\n",vec[10]); prin
2016-05-27 10:16:18 19879
原创 windows下简单的命令行
cmd下对应于Linux下的显示当前路径命令ped是cdcmd下对应于Linux下显示当前文件夹下所有的文件命令ls是DIR或dircmd下对应与Linux下切换文件夹名称是一样的,都是cd,但是如果要在几个分区,如C盘和D盘之间进行切换的话,直接输入E:,就可以了
2016-05-27 09:22:00 433
原创 HTK
基于HTK语音工具包 的学习(中文):http://blog.sina.com.cn/s/blog_436992740102uwub.htmlHTK入门讲解:http://blog.csdn.net/neustar1/article/details/19283017(HTK连续语音识别)http://m.blog.csdn.net/blog/u010384318/176
2016-05-26 10:58:24 646
原创 GMM-HMM语音识别
现在假设知道了HMM模型中的一个状态(比如,孤立此识别中,这里一个状态代表一个词)对应的K个多维高斯的所有参数,则该GMM生成该状态(该词)上某一个观察向量()的概率就出来了,即,知道了某个孤立词对应的K个高斯模型的所有参数,那么,就可以计算一帧观测值对于该词的概率。以下是文献中提到的 机器学习&数据挖掘笔记_14(GMM-HMM语音识别简单理解)为了对GMM-H
2016-05-26 10:57:54 3271
原创 speex
Speex是基于CELP并且专门为码率在2-44kbps的语音压缩而设计的。它的特点有:■窄带(8kHz),宽带(16kHz)和超宽带(32kHz)压缩于同一位流。■强化立体编码■数据包丢失隐蔽■可变比特率(VBR)■语音捕捉(VAD)■非连续传输(DTX)■定点运算■感官回声消除(AEC):http://www.cnblogs.com/kinyer/p/3
2016-05-26 10:57:04 865
原创 webrtc杂项
http://blog.csdn.net/ruichen198706/article/details/8287240:使用该AEC算法要注意两点:1)延时要小,因为算法默认滤波器长度是分为12块,每块64点,按照8000采样率,也就是12*8ms=96ms的数据,而且超过这个长度是处理不了的。2)延时抖动要小,因为算法是默认10块也计算一次参考数据的位置(即滤波器能量最大的那一
2016-05-26 10:55:32 399
原创 部分音频特征
在本文件夹的 low-level features and timbre文本有有对相应的特征参数代表的物理意义的解释来自文献 全自动中文新闻字幕生成系统的设计与实现频谱质心(spectral centroid,SC)频谱能量的集中点,一般来说,此值越小,说明越多的能量集中在低频范围内。频谱差分幅度(spectral flux,SF)一个音频段中的相邻两帧之间谱的平均变化量频
2016-05-26 10:51:20 4421
原创 倒谱与梅尔倒谱的区别
梅尔频率倒谱是倒谱的一种应用,梅尔倒谱常应用在声音信号处理,对于声音信号处理比倒谱更接近人耳对声音的分析特性,而梅尔频率倒谱与倒谱的差别在于:1 梅尔频率倒谱的频带分析是根据人耳听觉特性所设计,人耳对于频率的分辨能力,是由频率的比值决定,也就是说,人耳对200Hz和300Hz之间的差别与2000Hz与3000Hz之间的差别是相同的。2 梅尔频率倒谱是针对信号的能量取对数,而
2016-05-26 10:49:06 3542
原创 倒谱分析与倒谱求法
倒谱分析可检测频谱中的重复模式,使其对区分多个故障非常有用,该故障在不同的主要频谱(即FFT、阶次、包络和增强频谱)中很难看到。 最重要的行业应用与机械诊断相关,如齿轮箱分析,以及其他应用,如:1 回声检测和去除2 以及语音分析 在以下网站中:http://www.bksv.cn/Products/analysis-software/signal-a
2016-05-26 10:48:20 22956 7
原创 信号分帧的条件
一帧信号至少必须包含2个基本周期以上,才能够显示语音的特性。比如,对于已知人声的音高范围大约在50Hz和1000Hz之间,因此对于一个采样频率,如取采样频率为8000Hz,那么当音高f=50Hz(例如男低音的歌声)时,每个基本周期的点数是fs/f=8000/50=160,因此,每一帧必须至少是320点,若音高是1000Hz(如女高音的歌声)时,每个基本周期的点数是8000
2016-05-26 10:46:41 1993
原创 谱估计
谱估计,是对随机信号序列进行功率谱密度估计算法的总称,属于频域中描述随机信号特性的分析方法之一,随机信号是不确定的,不能够用清晰的数学式表达,只能根据随机过程理论,利用统计方法来进行分析。经常利用均值、均方值,相关函数和功率谱密度函数等统计量来藐视随机过程的特征或随机信号的特性。实际上,经常遇到的随机过程多是平稳随机过程而且是各态历经的,因而它的样本函数集的平均可以根据某一个函数的时间平均
2016-05-26 10:44:34 2462
原创 音调
声音频率的高低叫音调,英文pitch,是声音的三个主要的主观属性,即音量(响度),音调,音色(音品)之一。 对于一定强度的纯音,音调随着频率的升降而升降 对于一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音调却随强度增加而上升。大体上,2000赫兹以下的低频纯音的音调随响度的增加而下降,3000赫兹以上高频纯音的音调随响度的增加而上升。 声
2016-05-26 10:44:05 1791
原创 语音模型
1 语音生成系统 发声器官:声带,声道 声带:声音的激励,开启闭合一次形成浊音的激励脉冲,其频率为60-450hz,也称为基音频率 声道:从声带到嘴唇的呼吸通道,声音的信道,决定一个人的声纹 人声按照声带振动与否,分为浊音与清音人声发音原理:a 声带开启与闭合,产生一定频率的激励信号,通过声道,产生浊音b 声带不振动,由声道(包括口
2016-05-26 10:43:35 3342
原创 Z变换与系统函数
A Z变换(英文:z-transformation)可将时域信号(即:离散时间序列)变换为在复频域的表达式。它在离散时间信号处理中的地位,如同拉普拉斯变换在连续时间信号处理中的地位。离散时间信号的Z变换是分析线性时不变离散时间系统问题的重要工具,在数字信号处理、计算机控制系统等领域有着广泛的应用。 B Z变换具有许多重要的特性:如线性、时移性、微分性、序列
2016-05-24 09:21:25 6669
原创 信号与系统相关网站
自动控制http://jpkc.zju.edu.cn/k/506/ycon.htm系统函数零极点与系统时域特性的关系http://jpkc.wyu.edu.cn/xhyxt/kejian/chapter4/4.5.3.htm连续时间LTI系统的系统函数http://jpkc.wyu.edu.cn/xhyxt/kejian/chapter4/4.5.1.htmThe role
2016-05-19 18:00:42 665
转载 语音及音频相关
语音共振峰详解http://www.sfu.ca/sonic-studio/handbook/Formant.htmlhttp://person2.sol.lu.se/SidneyWood/praate/whatform.htmlhttp://www.fon.hum.uva.nl/praat/manual/Formant.html语音信号的形成机制http://hype
2016-05-19 17:18:16 1001
转载 Linux
Linux Shell 之 我的第一个Shell程序http://blog.csdn.net/ljianhui/article/details/9324971Linux下的.o,.so,.a,.la文件的整理http://www.cnblogs.com/fengyv/archive/2012/08/10/2631313.htmlLinux下Gcc生成和使用静态库和动态库详解
2016-05-19 17:00:48 376
原创 尝试自己写简单的retinex
#include "opencv2/opencv.hpp"#include #include #include #include #include using namespace std;using namespace cv;//image是原始图像,conv是原始图像加卷积后的图像,deconv是解卷积后的图像int deconvolution(Mat
2016-05-18 18:11:41 1012
OpenCV 2 Computer Vision Application Programming Cookbook
2016-05-31
Multiple_View_Geometry_in_Computer_Vision__2nd_Edition
2016-05-31
A Practical Introduction to Computer Vision with OpenCV
2016-05-31
speex降噪文献
2016-05-31
基于OpenCV的计算机视觉技术实现
2016-05-31
Algorithms_for_Image_Processing_and_Computer_Vision
2016-05-31
OpenCV Computer Vision Application Programming Cookbook Second Edition
2016-05-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人