jiangyangbo-CSDN博客

原创 PyTorch机器学习从入门到实战

人工智能入门实践，轻松玩转PyTorch框架。校宝在线出品的书籍《PyTorch机器学习从入门到实战》发售了！购书链接：内容简介近年来，基于深度学习的人工智能掀起了一股学习的热潮。本书是使用PyTorch深度学习框架的入门书籍。本书从深度学习原理入手，由浅入深，阐述深度学习中神经网络、深度神经网络、卷积神经网络、自编码器、循环神经网络等，同时穿插学习PyTorch框架...

2018-11-05 10:57:30 4822

原创 python 处理 excel格式文件

python 调用xlrd package就可以处理excel文件. 简单例子如下:源码如下:# -*- coding: utf-8 -*-import xlrd #----------------------------------------------------------------------def open_file(path): "

2016-05-19 15:54:49 826

原创 specgram python

# -*- coding: utf-8 -*import numpy as np import scipy as spimport waveimport structimport matplotlib.pylab as pl#********************参数设置********************%winsize=512;

2016-04-25 18:54:52 4314

原创欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-04-25 18:53:12 344

原创 kaidi中 install cuda

1, 官网网址， cuda nvidia linux install http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#ubuntu-installation2 , lspci | grep -i nvidia GeForce GTX 750

2016-04-21 14:58:21 1062

原创听音训练手册--音频制品与听评

听音训练手册--音频制品与听评jason corey zhu

2014-08-10 19:00:50 2784

转载 An Overview of Acoustic Modeling Techniques from ICASSP 2012

An Overview of Acoustic Modeling Techniques from ICASSP 2012Tara N. SainathSLTC Newsletter, May 2012The International Conference on Acoustic, Audio and Signal Processing (ICASSP) was recen

2013-02-03 21:08:37 1570

转载 Siri and the Kai-Fu Effect

Siri and the Kai-Fu EffectRoberto PieracciniSLTC Newsletter, May 2012The recent excitement around speech recognition caused by the popularity of Apple's Siri reminds me of the research atm

2013-02-03 21:06:11 799

转载 The Kaldi Speech Recognition Toolkit

The Kaldi Speech Recognition ToolkitArnab Ghoshal and Daniel PoveySLTC Newsletter, February 2012Kaldi is a free open-source toolkit for speech recognition research. It is written in C++ an

2013-02-03 20:19:44 4629

转载 An Overview of Acoustic Modeling Techniques from ASRU 2011

An Overview of Acoustic Modeling Techniques from ASRU 2011Tara N. SainathSLTC Newsletter, January 2012The Automatic Speech Recognition and Understanding Workshop (ASRU) was recently hosted

2013-02-03 20:17:28 1944

转载 Interspeech 2012 Recap

Interspeech 2012 RecapPortland proved to be a great venue for this year's Interspeech. (Though people who attended ACL 2011 probably already could have guessed that.)Setting up three si

2012-09-21 00:32:40 986

原创 python调试

调试模式：python -m pdb mysqcript.py单步调试：n断点：b n(行数)，跟c配合使用，（类似perl语言）。cl :清除断点。查看变量:p para(变量名称)w ：列出目前call stack 中的所在层l : #查看运行到某处代码d :在call stack中往下移一层u :在call stack中往上移一层。如果在上移一层之

2012-02-05 21:28:48 439

原创有源降噪装置专利(转)

申请专利号200410047432.4 　专利申请日2004.05.28 　名称有源降噪装置公开（公告）号1573919公开（公告）日2005.02.02 　颁证日　优先权2003.5.29 JP 2003－151827申请（专利权）松下电器产业株式会社;本田技研工业株式会社　地址日

2011-06-21 14:37:00 1719

原创 matlab特殊函数

http://ceta.mit.edu/ceta/comp_spec_func/http://ceta.mit.edu/ceta/LIST OF PROGRAMS: mbernoa.m (BERNOA) Evaluate a sequence of Bernoulli numbers (method 1). mbernob.m (BERNOB) Evaluate a sequence of

2011-06-21 14:29:00 6983 2

转载 gprof 使用例程（转）

使用 GNU profiler 来提高代码运行速度Martyn Honeyford (martynh@uk.ibm.com), 软件工程师, IBM UK LabsMartyn Honeyford 1996 年毕业于诺丁汉大学，获计算机科学学士学位。从那时起，他就成为位于英格兰 Hursley 的 IBM 英国实验室的一名软件工程师。他目前的职务是 WebSphere MQ Every

2011-06-14 15:31:00 954

原创 VTLN(Vocal Tract Length Normalisation)

VTLN是Vocal Tract Length Normalisation 的简称。中文为：声道长度归一化。主要用于语音识别，消除男，女的声道长度的差异。在HTK中有源码，HTK book中有介绍。修改了MEL频率中的中心频率。用到的参数：WARPFREQLOFREQHIFREQvariables (WARPLCUTOFF) and (WARPUCUTOFF).变量IOConfigRec

2011-06-10 11:02:00 15398 1

这是一个关于忠诚和忠告的故事。 一个男人新婚不久，由于家境贫寒，决定出外谋生。在外遇到一个好心的木雕工艺大师收他做了学徒，并同他约定：当他学成出师的时候就可以离开并且有工钱。做了学徒二十年，男人学会制作木雕的方方面面，终于学成出师可以回家。师傅问他：你是要二十年的工钱还是要三句忠告？男人说我明天上路，明早给你您答案好吗？师傅说可以。 当晚男人彻夜未眠。早晨，他对师傅说：我要三个忠告。于是师傅给了他三句话。一、不要试图寻找不可能的捷径

2011-03-07 15:56:00 954

原创音量的计算

音量又称响度、音强，是指人耳对所听到的声音大小强弱的主观感受，其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力，即声压。物体振动通过不同的介质，将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标，就把声压分成“级”——声压级，以便能客观的表示声音的强弱，其单位称为“分贝”（dB）。 音量的计算 1，声音数据data,长度为len 方法1，音量为声音的最大值减去最小值的一半,类似均值。 function vol1

2011-02-25 20:56:00 6460

原创语音增强效果的测试方法

侵入式检测，p.563

2011-02-15 09:07:00 4470 2

原创中心频率

Y = fft(y,1024); Pyy = Y.* conj(Y)/1024; f = fs*(0:512)/1024; figure; plot(f,Pyy(1:513)); f是每个fft 的 bin上的中心频率

2010-12-29 20:04:00 1959

原创语音识别技术的先锋

语音识别技术的先锋当Frederick Jelinek 去世的时候，人家才发现一个开创语音识别领域新时代的人和大家说再见了。因为在他之前，贝尔实验室的john pierce 曾经在美国声学学会会刊上悲观地写道：speech recognition was dominated by "mad scientists and untrustworthy engineers" and that "speech re

2010-12-27 21:02:00 1436

原创函数指针的两个例子，

（1） #include "stdio.h" typedef int Elem; //int (* compare)(Elem , Elem); int ascending(Elem a, Elem b); int descending(Elem a, Elem b); void selectionsort(Elem *, Elem,int (*compare)()); void warp(Elem *a, Elem *b);

2010-12-19 23:37:00 600

原创一个简单的RASTA matlab CODE

function y=rasta(x,fs,low,high) % function y=rasta(x,fs) where x is the input data (rows of time data), % and fs is the frame rate (sampling rate) in Hz. This is a modified % version of the original filter. Here the RASTA fil

2010-10-14 10:53:00 1258

原创 CNG(舒适噪声生成）

舒适噪音生成（comfort noise generator，CNG）是一个在通话过程中出现短暂静音时用来为电话通信产生背景噪声的程序。 　　舒适噪音生成是VoIP技术中静音抑制（silence suppression）或语音活动检测（VAD）的一部分。语音活动检测及舒适噪音生成是用来维持一个感受到的可接受的服务品质，同时尽可能降低传输成本和带宽使用。 　　结合语音活动检测算法的舒适噪音生成可快速确定静音出现的时间，并在出现静音时产生人工噪音，直到语音

2010-10-14 10:35:00 9876

原创语谱图

[y1,fs,nbits] = wavread('D:/data/sp01.wav'); //语音文件自己修改 figure(1); specgram(y1,256,8000,256,128); title('sp01'); x = y1; nfft = 256; Fs = 8000; Window =window(256); Noverlap = 128; nx = l

2010-09-21 13:52:00 13340 2

原创麦克风的指向性

声学基础上有(下册,好像是第六章,声波的接收). 传声器只是前腔开透声孔,声压式,全指向性; 传声器前后腔对称开透声孔,压差式,双指向性(∞); 传声器前后腔不对称(或側面)开透声孔,复合式,单指向性(心型,超心型); 压强式传声器是全指的，压差式是8字的指向性，单指向传声器是2者的复合，有心形，超心型等等。 单指向产品它的实现方式有2种，一种是从电路上入手，一种是从声学结构上入手，这就是大多数工厂采用的相移传声器。成本低，工艺上容易

2010-09-21 13:51:00 7263

原创边缘检测的简单例子(MATLAB)

x = - 2 : 0.05: 2; y = - 2 : 0.05: 2; sigma = 0.5 ; y = y'; for i = 1: ( 4 /0.05 + 1) xx( i, : ) = x; yy( : , i ) = y; end % 产生矩形网格 r = 1 / ( 2* pi* sigma^4) * ( ( xx.^2 + yy.^2 ) / ( sigma^2) - 2).* ...<b

2010-09-21 13:45:00 1340

原创 makefile问题

编译时，makefile如下： CFLAGS= -g INCS= # use the following line to "Purify" the code #CC=purify gcc CC=gcc SRCS=baum.c viterbi.c forward.c backward.c hmmutils.c sequence.c / genseq.c nrutil.c testvit.c esthmm.c hmmrand.c

2010-08-31 08:57:00 847

原创 dll的创建和使用

dll的创建和使用 1，dll创建， 简单例子， 建立三个文件，DllName.cpp,DllName.def,DllName.h, 在DllName.cpp，中 int _stdcall getAge(void) { return 318; } 在DllName.def中， EXPORTS getA

2010-08-25 11:23:00 438

原创 srilm编译，

Srilm的全称是Stanford Research Institute Language Modeling Toolkit 他被用来构建和应用统计语言模型，主要用于语音识别，统计标注和切分，以及机器翻译等工作ubuntu编译，可以再52nlp中取找。VC编译，可以再下面链接找，http://www.keithv.com/software/srilm/以VS2008为例，可以下载最新的SRILMInstructions Download and unpack the SRILM toolkit.Unzip

2010-08-11 17:49:00 1324

原创决策树c4.5编译，

决策树的编译 在cygwin下编译，有两个错误， 1）出现cfree，找了下，在 http://www.mkssoftware.com/docs/man3/free.3.asp 提到： void free(void *ptr); void cfree(void *ptr); 应该cfree的用法和free的用法是一样的，把所有cfree,改为free 2）exit , 在average.c中

2010-08-04 13:35:00 833

转载一些重要的算法(转)

面是一些比较重要的算法，原文罗列了32个，但我觉得有很多是数论里的或是比较生僻的，和计算机的不相干，所以没有选取。下面的这些，有的我们经常在用，有的基本不用。有的很常见，有的很偏。不过了解一下也是好事。也欢迎你留下你觉得有意义的算法。（注：本篇文章并非翻译，其中的算法描述大部份摘自Wikipedia，因为维基百科描述的很专业了） 1.A*搜寻算法 俗称A星算法。这是一种在图形平面上，有多个节点的路径，求出最低通过成本的算法。常用于游戏中的NPC的移动计算，或线上游戏的BOT的

2010-07-26 08:59:00 338

原创 SVM 实现与代码（转）

http://www.360doc.com/content/07/0426/10/24937_467616.shtml

2010-06-28 22:51:00 509

原创单引号，双引号，

单引号是字符的意义，双引号是字符串的意义。

2010-06-28 15:39:00 360

原创需要在函数中传递的变量

要在函数中传递的变量， 大致可以分为，单个数值的，一维数值的，或者二维数值的， 1）单个数值， 形如：float m_fElement; （1）在函数中定义float *m_fElement,调用的时候， &m_fElement， （2）定义为static float m_fElement 2）一维数值， 形如：float *m_pfElement; (1) 在函数值定义 float *m_pfEl

2010-06-28 10:06:00 475

转载 vc 中C 语言命名规范（转）

命名规范

2010-06-09 16:59:00 603

原创 speex版本下载

speex

2010-06-08 11:14:00 3537

转载 WINDOWS下对音频的处理过程(转)

WINDOWS下对音频的处理过程 WINDOWS下对音频的处理，大致可分为两部分，即音频的输入、输出，和ACM压缩处理。 　　一般情况下在WINDOWS下可以调用诸如sndPlaySound等API(MCI)来播放一个WAV文件，但那显然不是我们需要做的。必须能够直接对音频数据流进行处理。在WINDOWS下，也为之提供了一系列的API，以waveIn和waveOut开头的一组API就是干这个的。 　　先说输入吧。常用的相关API为waveInOpen（打开一个音频输

2010-06-07 09:44:00 582

原创 find与grep命令简介及正则表达式（转）

find, grep

2010-06-07 09:28:00 579

原创 mp3 resource

mp3

2010-06-01 09:01:00 730

speech recognition:statistics methods

A noise reduction processor for Mobile voice communication

lpc代码，MATLAB编写

空空如也