2016年05月_跬步达千里

12月 11月 10月 09月 08月 07月 06月 05月

原创关于音频降噪

常见的音频降噪算法，对于加性平稳随机噪声，效果还是很不错的，加性平稳随机噪声的假设是很多语音增强的假设前提。关于非平稳噪声，比如，发动机的轰鸣声、风声、街道上别人的声音，就需要根据场景来处理，要单独处理。

2016-05-31 11:31:03 4068

转载通过命令的方式实现计算机定时关机

http://jingyan.baidu.com/article/59a015e3872228f7948865c8.html

2016-05-27 18:10:34 383

原创 opencv编译contrib部分

1 先在官网下载opencv2 在网址：https://github.com/Itseez/opencv_contrib下载contrib部分的代码3 下载cmake gui：http://www.cmake.org/cmake/resources/software.html然后按照以下步骤进行：打开cmake-gui在where is the source cod

2016-05-27 17:24:00 1461

转载 opencv的change log

https://github.com/Itseez/opencv/wiki/ChangeLog

2016-05-27 16:08:46 517

原创 vector的初始化问题

vector也是可以初始化的，可以指定初始的长度和初始的值vector rho(nSamples, 0);nSamples是初始的长度，0是初始的值

2016-05-27 15:14:57 595

原创朴素贝叶斯

朴素贝叶斯的核心在于样本的每个特征属性之间是假定不相关的所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关：例如，如果一种水果其具有红，圆，直径大概3英寸等特征，该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定，然而朴素贝叶斯分类器认为这些属性在判定该水果是否为苹果的概率分布上独立。对于某些类型的概率模型，在监督式学习集中能获取得非

2016-05-27 11:29:00 420

原创最大似然估计

说的通俗一点啊，最大似然估计，就是利用已知的样本结果，反推最有可能（最大概率）导致这样结果的参数值。例如：一个麻袋里有白球与黑球，但是我不知道它们之间的比例，那我就有放回的抽取10次，结果我发现我抽到了8次黑球2次白球，我要求最有可能的黑白球之间的比例时，就采取最大似然估计法：我假设我抽到黑球的概率为p,那得出8次黑球2次白球这个结果的概率为：P(黑=8)=p^8*（1-p）^2

2016-05-27 10:44:02 723

原创 C++纯虚函数

在C++中如果在一个函数的声明中加上virtual ，并且降这个函数赋值为0，那么证明这个函数是纯虚函数，函数的特点如下：1 该函数在声明的地方不能够对其进行定义，即，不能够给出其具体的实现2 该函数在其继承的函数中必须要实现，即，要给出其具体的实现3 该函数所在的类不能够创建对象（即，不能够实例化），但是可以声明指针

2016-05-27 10:40:17 378

原创函数参数名后面加const的意义

const int* i=0; 代表i是常量，里面的值不能够变int* const i=; 代表指针i是常量，所指的内容可以修改const对象只能调用const成员函数（所谓const成员函数，是指在函数的参数括号后面添加const的函数，比如int a(int i) const{}）。 const对象的值不能被修改，在const成员函数中修改

2016-05-27 10:38:56 5948

原创类声明和定义中const、inline、默认参数、explicit、static、virtual的出现频率

1 在类申明中，在形参表之后添加关键字const，使成员函数变成常量（我们可以理解为将this指定指定为常量），如此便不能通过成员函数来修改对象的数据成员，无论是共有的还是私有的。例如double avg_price() const;该函数avg_price()不能更改对象的任何数据成员。需要强调一点的是：const关键字必须同时出现在类的申明和定义中，若只出现一次，将会报错。2 如果类的

2016-05-27 10:37:46 633 1

原创 SVM中遇到的非均衡数据集

对于SVM中遇到的非均衡数据集，可以采用以下策略：假设有4类样本，比如，第一类有500个，第二类有300个，第三类有600个，第四类有200个，那么，可以通过SVM的class_weights（CvSVM中有该参数）来进行均衡，具体如下，1 求所有样本和，在这里为16002 求每一类样本数与总数的比值，如在这里为 500/1600=0.3125， 300

2016-05-27 10:36:42 3294 1

转载 libsvm 训练后的模型参数讲解

本帖子主要就是讲解利用libsvm-mat工具箱建立分类回归模型后得到的模型model里面参数的意义都是神马以及如果通过model得到相应模型的表达式这里主要以分类问题为例子。测试数据使用的是libsvm-mat自带的heart_scale.mat数据270*13的一个属性据矩阵共有270个样本每个样本有13个属性方便大家自己测试学习。首先上

2016-05-27 10:35:16 3240

原创 40个图像处理开源库

40个图像处理开源库：Face Recognition - 拉姆达实验室斯蒂芬弄的。示例代码和图形演示点击http://api.lambdal.com/docs，我们的API提供了面部识别，面部检测，眼睛定位，鼻子定位，嘴巴定位，和性别分类。如果您有任何疑问，只需发一封邮件到[email protected]。Face (Detection) - 计算机视觉面部识别和面部检测。这是一个完

2016-05-27 10:31:24 4256

原创变量存储区

静态存储区：全局，静态变量之类的都在静态存储区域分配栈：执行函数时，函数内部局部变量的存储单元在栈上创建，函数执行完时自动释放堆：堆上分配也叫动态内存分配，程序在运行的时候用malloc或new申请

2016-05-27 10:29:59 401

原创 VS筛选器

使用vs2010开发项目时，有时源码文件过多，想按功能进行分类管理，这个时候就可以使用“筛选器（filter）”。添加筛选器很简单，在项目上右键单击，选择“添加 | 新建筛选器”，然后命名就可以了。之后向筛选器中添加文件。创建筛选器之后，要注意工程目录下的“*.filters”文件一定不能删掉，因为这个文件就是用来记录筛选器的。还有一个问题就是，有

2016-05-27 10:28:33 2216 1

原创 explicit构造函数

关键字explicit，可以阻止不应该允许的经过转换构造函数进行的隐式转换的发生。声明为explicit的构造函数不能在隐式转换中使用。　　C++中，一个参数的构造函数(或者除了第一个参数外其余参数都有默认值的多参构造函数)，承担了两个角色。 1 是个构造器 2 是个默认且隐含的类型转换操作符。　　所以，有时候在我们写下如 AAA = XXX，这样的代码，且恰好XXX的类

2016-05-27 10:19:19 391

原创 extern "C"的用法解析

extern "C"的用法解析（1 extern C修饰，1是指全局变量；）（2是指被extern "C"修饰的变量和函数是按照C语言方式编译和连接的）1.引言　　C++语言的创建初衷是“a better C”，但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言，C++保留了一部分过程式语言的特点（被世人

2016-05-27 10:18:28 696

原创数据结构中的堆栈和内存中的堆栈

数据结构中的堆栈： 1 都是一种数据按序排列的数据结构，只能在一端对数据进行插入和删除 2 堆：队列优先，先进先出；栈，先进后出内存分配中的堆栈，在C++中内存分成5个区，分别是堆、栈、自由存储区、全局/静态存储区、常量存储区。 1 栈，就是那些有编译器在需要的时候分配，在不需要的时候自动清除的变量存储区。里面的变量基本上是局部变量、函数参数等，栈由系统自

2016-05-27 10:17:48 687

原创 C++中vector删除指定位置的元素

1、可以用erase方法删除vector指定位置的元素。2、例程：#include #include using namespace std;int main(int argc, char** argv){ std::vector vec; for(int i=0;i printf("10:%d\n",vec[10]); prin

2016-05-27 10:16:18 19879

原创 windows下简单的命令行

cmd下对应于Linux下的显示当前路径命令ped是cdcmd下对应于Linux下显示当前文件夹下所有的文件命令ls是DIR或dircmd下对应与Linux下切换文件夹名称是一样的，都是cd，但是如果要在几个分区，如C盘和D盘之间进行切换的话，直接输入E:，就可以了

2016-05-27 09:22:00 433

原创 HTK

基于HTK语音工具包的学习（中文）：http://blog.sina.com.cn/s/blog_436992740102uwub.htmlHTK入门讲解：http://blog.csdn.net/neustar1/article/details/19283017（HTK连续语音识别）http://m.blog.csdn.net/blog/u010384318/176

2016-05-26 10:58:24 646

原创 GMM-HMM语音识别

现在假设知道了HMM模型中的一个状态（比如，孤立此识别中，这里一个状态代表一个词）对应的K个多维高斯的所有参数，则该GMM生成该状态（该词）上某一个观察向量（）的概率就出来了，即，知道了某个孤立词对应的K个高斯模型的所有参数，那么，就可以计算一帧观测值对于该词的概率。以下是文献中提到的机器学习&数据挖掘笔记_14（GMM-HMM语音识别简单理解）为了对GMM-H

2016-05-26 10:57:54 3271

原创 speex

Speex是基于CELP并且专门为码率在2-44kbps的语音压缩而设计的。它的特点有：■窄带（8kHz），宽带（16kHz）和超宽带（32kHz）压缩于同一位流。■强化立体编码■数据包丢失隐蔽■可变比特率（VBR）■语音捕捉（VAD）■非连续传输（DTX）■定点运算■感官回声消除（AEC）：http://www.cnblogs.com/kinyer/p/3

2016-05-26 10:57:04 865

原创 webrtc杂项

http://blog.csdn.net/ruichen198706/article/details/8287240：使用该AEC算法要注意两点：1）延时要小，因为算法默认滤波器长度是分为12块，每块64点，按照8000采样率，也就是12*8ms=96ms的数据，而且超过这个长度是处理不了的。2）延时抖动要小，因为算法是默认10块也计算一次参考数据的位置（即滤波器能量最大的那一

2016-05-26 10:55:32 399

原创部分音频特征

在本文件夹的 low-level features and timbre文本有有对相应的特征参数代表的物理意义的解释来自文献全自动中文新闻字幕生成系统的设计与实现频谱质心（spectral centroid，SC）频谱能量的集中点，一般来说，此值越小，说明越多的能量集中在低频范围内。频谱差分幅度（spectral flux，SF）一个音频段中的相邻两帧之间谱的平均变化量频

2016-05-26 10:51:20 4421

原创倒谱与梅尔倒谱的区别

梅尔频率倒谱是倒谱的一种应用，梅尔倒谱常应用在声音信号处理，对于声音信号处理比倒谱更接近人耳对声音的分析特性，而梅尔频率倒谱与倒谱的差别在于：1 梅尔频率倒谱的频带分析是根据人耳听觉特性所设计，人耳对于频率的分辨能力，是由频率的比值决定，也就是说，人耳对200Hz和300Hz之间的差别与2000Hz与3000Hz之间的差别是相同的。2 梅尔频率倒谱是针对信号的能量取对数，而

2016-05-26 10:49:06 3542

原创倒谱分析与倒谱求法

倒谱分析可检测频谱中的重复模式，使其对区分多个故障非常有用，该故障在不同的主要频谱（即FFT、阶次、包络和增强频谱）中很难看到。最重要的行业应用与机械诊断相关，如齿轮箱分析，以及其他应用，如：1 回声检测和去除2 以及语音分析在以下网站中：http://www.bksv.cn/Products/analysis-software/signal-a

2016-05-26 10:48:20 22956 7

原创信号分帧的条件

一帧信号至少必须包含2个基本周期以上，才能够显示语音的特性。比如，对于已知人声的音高范围大约在50Hz和1000Hz之间，因此对于一个采样频率，如取采样频率为8000Hz，那么当音高f=50Hz（例如男低音的歌声）时，每个基本周期的点数是fs/f=8000/50=160，因此，每一帧必须至少是320点，若音高是1000Hz（如女高音的歌声）时，每个基本周期的点数是8000

2016-05-26 10:46:41 1993

原创谱估计

谱估计，是对随机信号序列进行功率谱密度估计算法的总称，属于频域中描述随机信号特性的分析方法之一，随机信号是不确定的，不能够用清晰的数学式表达，只能根据随机过程理论，利用统计方法来进行分析。经常利用均值、均方值，相关函数和功率谱密度函数等统计量来藐视随机过程的特征或随机信号的特性。实际上，经常遇到的随机过程多是平稳随机过程而且是各态历经的，因而它的样本函数集的平均可以根据某一个函数的时间平均

2016-05-26 10:44:34 2462

原创音调

声音频率的高低叫音调，英文pitch，是声音的三个主要的主观属性，即音量（响度），音调，音色（音品）之一。对于一定强度的纯音，音调随着频率的升降而升降对于一定频率的纯音、低频纯音的音调随声强增加而下降，高频纯音的音调却随强度增加而上升。大体上，2000赫兹以下的低频纯音的音调随响度的增加而下降，3000赫兹以上高频纯音的音调随响度的增加而上升。声

2016-05-26 10:44:05 1791

原创语音模型

1 语音生成系统发声器官：声带，声道声带：声音的激励，开启闭合一次形成浊音的激励脉冲，其频率为60-450hz，也称为基音频率声道：从声带到嘴唇的呼吸通道，声音的信道，决定一个人的声纹人声按照声带振动与否，分为浊音与清音人声发音原理：a 声带开启与闭合，产生一定频率的激励信号，通过声道，产生浊音b 声带不振动，由声道（包括口

2016-05-26 10:43:35 3342

原创 Z变换与系统函数

A Z变换（英文：z-transformation）可将时域信号（即：离散时间序列）变换为在复频域的表达式。它在离散时间信号处理中的地位，如同拉普拉斯变换在连续时间信号处理中的地位。离散时间信号的Z变换是分析线性时不变离散时间系统问题的重要工具，在数字信号处理、计算机控制系统等领域有着广泛的应用。 B Z变换具有许多重要的特性：如线性、时移性、微分性、序列

2016-05-24 09:21:25 6669

转载用于求两个向量之间的距离

http://blog.csdn.net/shiwei408/article/details/7602324

2016-05-21 11:31:48 4270

转载代码运行效率优化

http://blog.csdn.net/gogdizzy/article/details/9003369

2016-05-20 14:38:33 362

原创信号与系统相关网站

自动控制http://jpkc.zju.edu.cn/k/506/ycon.htm系统函数零极点与系统时域特性的关系http://jpkc.wyu.edu.cn/xhyxt/kejian/chapter4/4.5.3.htm连续时间LTI系统的系统函数http://jpkc.wyu.edu.cn/xhyxt/kejian/chapter4/4.5.1.htmThe role

2016-05-19 18:00:42 665

转载语音及音频相关

语音共振峰详解http://www.sfu.ca/sonic-studio/handbook/Formant.htmlhttp://person2.sol.lu.se/SidneyWood/praate/whatform.htmlhttp://www.fon.hum.uva.nl/praat/manual/Formant.html语音信号的形成机制http://hype

2016-05-19 17:18:16 1001

转载 Linux

Linux Shell 之我的第一个Shell程序http://blog.csdn.net/ljianhui/article/details/9324971Linux下的.o,.so,.a,.la文件的整理http://www.cnblogs.com/fengyv/archive/2012/08/10/2631313.htmlLinux下Gcc生成和使用静态库和动态库详解

2016-05-19 17:00:48 376

转载 opencv相关

http://blog.csdn.net/poem_qianmo/article/details/21479533#

2016-05-19 16:50:03 761

原创常见数学函数

1 幂函数 2 指数函数3 对数函数4 三角函数5 反三角函数6 双曲函数7 反双曲函数

2016-05-19 09:16:19 652

原创尝试自己写简单的retinex

#include "opencv2/opencv.hpp"#include #include #include #include #include using namespace std;using namespace cv;//image是原始图像，conv是原始图像加卷积后的图像，deconv是解卷积后的图像int deconvolution(Mat

2016-05-18 18:11:41 1012

OpenCV 2 Computer Vision Application Programming Cookbook

2016-05-31

Multiple_View_Geometry_in_Computer_Vision__2nd_Edition

2016-05-31

Learning Image Processing with OpenCV

2016-05-31

A Practical Introduction to Computer Vision with OpenCV

2016-05-31

VS2010编译opencv3.1加contrib部分

VS2010编译opencv3.1加contrib生成库文件

2016-05-30

高效聚类中dc求法

给出Clustering by fast search and find of density peaks中dc的求法

2016-05-27

高效聚类补充材料

Clustering by fast search and find of density peaks

2016-05-27

Real-Time Communication with WebRTC 高清.pdf版

Real-Time Communication with WebRTC

2016-05-27

Statistical.Pattern.Recognition

2016-05-27

Deep Learning 中文翻译

Deep Learning 中文翻译，绝对有用17年3-15刚出

2017-04-14

libsvm的程序代码注释

上海某实验室对libsvm做的代码注释，能够加速对libsvm的理解与使用

2016-09-23

自己写的去雾算法

注意，需要下载我上传的其他资源：编译的opencv3.1加contrib的库文件

2016-06-02

Learning OpenCV 2nd Early Release

2016-06-01

《基于OpenCV的计算机视觉技术实现》介绍了大约200多个典型的技术问题，覆盖了基于OpenCV基础编程的主要内容，利用大量生动有趣的编程案例和编程技巧，从解决问题和答疑解惑入手，以因特网上最新资料为蓝本，深入浅出地说明了OpenCV中最典型和用途最广的程序设计方法。《基于OpenCV的计算机视觉技术实现》结构清晰、合理，范例实用、丰富，理论结合实践，即使读者只是略懂计算机视觉原理，也能人手对相关理论方法直接进行编码实现。

2016-05-31

Algorithms_for_Image_Processing_and_Computer_Vision

2016-05-31

OpenCV Computer Vision Application Programming Cookbook Second Edition

2016-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

OpenCV 3 Blueprints

OpenCV 2 Computer Vision Application Programming Cookbook

Multiple_View_Geometry_in_Computer_Vision__2nd_Edition

Learning Image Processing with OpenCV

A Practical Introduction to Computer Vision with OpenCV

speex-api-reference

时间序列分析-汉密尔顿

增强语音识别（英文版）

speex降噪文献

linux下与windows下程序运行时间检测

VS2010编译opencv3.1加contrib部分

高效聚类中dc求法

高效聚类补充材料

Real-Time Communication with WebRTC 高清.pdf版

Statistical.Pattern.Recognition

最优化理论与算法

快速高效的聚类方法

纹理图像分析

人脸关键点编辑器

图像指定区域截取

Deep Learning 中文翻译

libsvm的程序代码注释

ML-MATLAB-CODE

MATLAB最优化计算

机器学习算法视角

Python-sklearn文档

keras1.0中文文档

信号处理第二版

speex相关文档

Android Studio

自己写的去雾算法

统计模式识别（原版第二版）.

Learning OpenCV 2nd Early Release

OpenCV Essentials

OpenCV By Example.

非负矩阵分解及其在音频中的应用

ANDROID下开发opencv

基于OpenCV的计算机视觉技术实现

Algorithms_for_Image_Processing_and_Computer_Vision

OpenCV Computer Vision Application Programming Cookbook Second Edition

空空如也