- 博客(52)
- 资源 (3)
- 收藏
- 关注
原创 PyTorch机器学习从入门到实战
人工智能入门实践, 轻松玩转PyTorch框架。校宝在线出品的书籍《PyTorch机器学习从入门到实战》发售了!购书链接: 内容简介近年来,基于深度学习的人工智能掀起了一股学习的热潮。本书是使用PyTorch深度学习框架的入门书籍。本书从深度学习原理入手,由浅入深,阐述深度学习中神经网络、深度神经网络、卷积神经网络、自编码器、循环神经网络等,同时穿插学习PyTorch框架...
2018-11-05 10:57:30 4822
原创 python 处理 excel格式文件
python 调用xlrd package就可以处理excel文件. 简单例子如下:源码如下:# -*- coding: utf-8 -*-import xlrd #----------------------------------------------------------------------def open_file(path): "
2016-05-19 15:54:49 826
原创 specgram python
# -*- coding: utf-8 -*import numpy as np import scipy as spimport waveimport structimport matplotlib.pylab as pl#********************参数设置********************%winsize=512;
2016-04-25 18:54:52 4314
原创 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-04-25 18:53:12 344
原创 kaidi中 install cuda
1, 官网网址, cuda nvidia linux install http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#ubuntu-installation2 , lspci | grep -i nvidia GeForce GTX 750
2016-04-21 14:58:21 1062
转载 An Overview of Acoustic Modeling Techniques from ICASSP 2012
An Overview of Acoustic Modeling Techniques from ICASSP 2012Tara N. SainathSLTC Newsletter, May 2012The International Conference on Acoustic, Audio and Signal Processing (ICASSP) was recen
2013-02-03 21:08:37 1570
转载 Siri and the Kai-Fu Effect
Siri and the Kai-Fu EffectRoberto PieracciniSLTC Newsletter, May 2012The recent excitement around speech recognition caused by the popularity of Apple's Siri reminds me of the research atm
2013-02-03 21:06:11 799
转载 The Kaldi Speech Recognition Toolkit
The Kaldi Speech Recognition ToolkitArnab Ghoshal and Daniel PoveySLTC Newsletter, February 2012Kaldi is a free open-source toolkit for speech recognition research. It is written in C++ an
2013-02-03 20:19:44 4629
转载 An Overview of Acoustic Modeling Techniques from ASRU 2011
An Overview of Acoustic Modeling Techniques from ASRU 2011Tara N. SainathSLTC Newsletter, January 2012The Automatic Speech Recognition and Understanding Workshop (ASRU) was recently hosted
2013-02-03 20:17:28 1944
转载 Interspeech 2012 Recap
Interspeech 2012 RecapPortland proved to be a great venue for this year's Interspeech. (Though people who attended ACL 2011 probably already could have guessed that.)Setting up three si
2012-09-21 00:32:40 986
原创 python调试
调试模式:python -m pdb mysqcript.py单步调试:n断点:b n(行数),跟c配合使用,(类似perl语言)。cl :清除断点。查看变量:p para(变量名称)w :列出目前call stack 中的所在层l : #查看运行到某处代码d :在call stack中往下移一层u :在call stack中往上移一层。如果在上移一层之
2012-02-05 21:28:48 439
原创 有源降噪装置专利(转)
申请专利号200410047432.4 专利申请日2004.05.28 名称有源降噪装置 公开(公告)号1573919公开(公告)日2005.02.02 颁证日 优先权2003.5.29 JP 2003-151827申请(专利权)松下电器产业株式会社;本田技研工业株式会社 地址日
2011-06-21 14:37:00 1719
原创 matlab特殊函数
http://ceta.mit.edu/ceta/comp_spec_func/http://ceta.mit.edu/ceta/LIST OF PROGRAMS: mbernoa.m (BERNOA) Evaluate a sequence of Bernoulli numbers (method 1). mbernob.m (BERNOB) Evaluate a sequence of
2011-06-21 14:29:00 6983 2
转载 gprof 使用例程(转)
使用 GNU profiler 来提高代码运行速度Martyn Honeyford (martynh@uk.ibm.com), 软件工程师, IBM UK LabsMartyn Honeyford 1996 年毕业于诺丁汉大学,获计算机科学学士学位。从那时起,他就成为位于英格兰 Hursley 的 IBM 英国实验室的一名软件工程师。他目前的职务是 WebSphere MQ Every
2011-06-14 15:31:00 954
原创 VTLN(Vocal Tract Length Normalisation)
VTLN是Vocal Tract Length Normalisation 的简称。中文为:声道长度归一化。主要用于语音识别,消除男,女的声道长度的差异。在HTK中有源码,HTK book中有介绍。修改了MEL频率中的中心频率。用到的参数:WARPFREQLOFREQHIFREQvariables (WARPLCUTOFF) and (WARPUCUTOFF).变量IOConfigRec
2011-06-10 11:02:00 15398 1
原创 三个忠告
<br /> <br /> 这是一个关于忠诚和忠告的故事。<br /> 一个男人新婚不久,由于家境贫寒,决定出外谋生。在外遇到一个好心的木雕工艺大师收他做了学徒,并同他约定:当他学成出师的时候就可以离开并且有工钱。做了学徒二十年,男人学会制作木雕的方方面面,终于学成出师可以回家。师傅问他:你是要二十年的工钱还是要三句忠告?男人说我明天上路,明早给你您答案好吗?师傅说可以。<br /> 当晚男人彻夜未眠。早晨,他对师傅说:我要三个忠告。于是师傅给了他三句话。一、不要试图寻找不可能的捷径
2011-03-07 15:56:00 954
原创 音量的计算
<br /><br />音量又称响度、音强,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。<br />音量的计算<br />1,声音数据data,长度为len<br />方法1,音量为声音的最大值减去最小值的一半,类似均值。<br /> function vol1
2011-02-25 20:56:00 6460
原创 中心频率
<br />Y = fft(y,1024);<br />Pyy = Y.* conj(Y)/1024;<br />f = fs*(0:512)/1024;<br />figure;<br />plot(f,Pyy(1:513));<br />f是每个fft 的 bin上的中心频率
2010-12-29 20:04:00 1959
原创 语音识别技术的先锋
语音识别技术的先锋 当Frederick Jelinek 去世的时候,人家才发现一个开创语音识别领域新时代的人和大家说再见了。因为在他之前,贝尔实验室的john pierce 曾经在美国声学学会会刊上悲观地写道:speech recognition was dominated by "mad scientists and untrustworthy engineers" and that "speech re
2010-12-27 21:02:00 1436
原创 函数指针的两个例子,
<br />(1)<br />#include "stdio.h"<br />typedef int Elem;<br />//int (* compare)(Elem , Elem);<br />int ascending(Elem a, Elem b);<br />int descending(Elem a, Elem b);<br />void selectionsort(Elem *, Elem,int (*compare)());<br />void warp(Elem *a, Elem *b);
2010-12-19 23:37:00 600
原创 一个简单的RASTA matlab CODE
<br /> <br />function y=rasta(x,fs,low,high)<br />% function y=rasta(x,fs) where x is the input data (rows of time data), <br />% and fs is the frame rate (sampling rate) in Hz. This is a modified <br />% version of the original filter. Here the RASTA fil
2010-10-14 10:53:00 1258
原创 CNG(舒适噪声生成)
<br />舒适噪音生成(comfort noise generator,CNG)是一个在通话过程中出现短暂静音时用来为电话通信产生背景噪声的程序。<br /><br /> 舒适噪音生成是VoIP技术中静音抑制(silence suppression)或语音活动检测(VAD)的一部分。语音活动检测及舒适噪音生成是用来维持一个感受到的可接受的服务品质,同时尽可能降低传输成本和带宽使用。<br /><br /> 结合语音活动检测算法的舒适噪音生成可快速确定静音出现的时间,并在出现静音时产生人工噪音,直到语音
2010-10-14 10:35:00 9876
原创 语谱图
<br />[y1,fs,nbits] = wavread('D:/data/sp01.wav'); //语音文件自己修改<br />figure(1);<br />specgram(y1,256,8000,256,128);<br />title('sp01');<br /> <br />x = y1;<br />nfft = 256;<br />Fs = 8000;<br />Window =window(256);<br />Noverlap = 128;<br /> <br />nx = l
2010-09-21 13:52:00 13340 2
原创 麦克风的指向性
<br />声学基础上有(下册,好像是第六章,声波的接收).<br />传声器只是前腔开透声孔,声压式,全指向性;<br />传声器前后腔对称开透声孔,压差式,双指向性(∞);<br />传声器前后腔不对称(或側面)开透声孔,复合式,单指向性(心型,超心型);<br /><br />压强式传声器是全指的,压差式是8字的指向性,单指向传声器是2者的复合,有心形,超心型等等。<br />单指向产品它的实现方式有2种,一种是从电路上入手,一种是从声学结构上入手,这就是大多数工厂采用的相移传声器。成本低,工艺上容易
2010-09-21 13:51:00 7263
原创 边缘检测的简单例子(MATLAB)
<br />x = - 2 : 0.05: 2;<br />y = - 2 : 0.05: 2;<br />sigma = 0.5 ;<br />y = y';<br />for i = 1: ( 4 /0.05 + 1)<br />xx( i, : ) = x;<br />yy( : , i ) = y;<br />end<br />% 产生矩形网格<br />r = 1 / ( 2* pi* sigma^4) * ( ( xx.^2 + yy.^2 ) / ( sigma^2) - 2).* ...<b
2010-09-21 13:45:00 1340
原创 makefile问题
<br />编译时,makefile如下:<br />CFLAGS= -g<br />INCS=<br /># use the following line to "Purify" the code<br />#CC=purify gcc<br />CC=gcc<br />SRCS=baum.c viterbi.c forward.c backward.c hmmutils.c sequence.c /<br /> genseq.c nrutil.c testvit.c esthmm.c hmmrand.c
2010-08-31 08:57:00 847
原创 dll的创建和使用
<br />dll的创建和使用<br />1,dll创建,<br />简单例子,<br />建立三个文件,DllName.cpp,DllName.def,DllName.h,<br />在DllName.cpp,中<br />int _stdcall getAge(void)<br /> {<br /> return 318;<br /> }<br />在DllName.def中,<br />EXPORTS<br /> getA
2010-08-25 11:23:00 438
原创 srilm编译,
Srilm的全称是Stanford Research Institute Language Modeling Toolkit 他被用来构建和应用统计语言模型,主要用于语音识别,统计标注和切分,以及机器翻译等工作ubuntu编译,可以再52nlp中取找。VC编译,可以再下面链接找,http://www.keithv.com/software/srilm/以VS2008为例,可以下载最新的SRILMInstructions Download and unpack the SRILM toolkit.Unzip
2010-08-11 17:49:00 1324
原创 决策树c4.5编译,
<br />决策树的编译<br />在cygwin下编译,有两个错误,<br />1)出现cfree,找了下,在<br />http://www.mkssoftware.com/docs/man3/free.3.asp<br />提到:<br />void free(void *ptr); <br />void cfree(void *ptr); <br /><br />应该cfree的用法和free的用法是一样的,把所有cfree,改为free<br />2)exit ,<br />在average.c中
2010-08-04 13:35:00 833
转载 一些重要的算法(转)
<br />面是一些比较重要的算法,原文罗列了32个,但我觉得有很多是数论里的或是比较生僻的,和计算机的不相干,所以没有选取。下面的这些,有的我们经常在用,有的基本不用。有的很常见,有的很偏。不过了解一下也是好事。也欢迎你留下你觉得有意义的算法。(注:本篇文章并非翻译,其中的算法描述大部份摘自Wikipedia,因为维基百科描述的很专业了)<br />1.A*搜寻算法<br />俗称A星算法。这是一种在图形平面上,有多个节点的路径,求出最低通过成本的算法。常用于游戏中的NPC的移动计算,或线上游戏的BOT的
2010-07-26 08:59:00 338
原创 SVM 实现与代码(转)
<br />http://www.360doc.com/content/07/0426/10/24937_467616.shtml
2010-06-28 22:51:00 509
原创 需要在函数中传递的变量
<br />要在函数中传递的变量,<br />大致可以分为,单个数值的,一维数值的,或者二维数值的,<br />1)单个数值,<br /> 形如:float m_fElement;<br /> (1) 在函数中定义float *m_fElement,调用的时候, &m_fElement,<br /> (2)定义为static float m_fElement<br />2)一维数值,<br /> 形如:float *m_pfElement;<br /> (1) 在函数值定义 float *m_pfEl
2010-06-28 10:06:00 475
转载 WINDOWS下对音频的处理过程(转)
<br />WINDOWS下对音频的处理过程<br />WINDOWS下对音频的处理,大致可分为两部分,即音频的输入、输出,和ACM压缩处理。<br /> 一般情况下在WINDOWS下可以调用诸如sndPlaySound等API(MCI)来播放一个WAV文件,但那显然不是我们需要做的。必须能够直接对音频数据流进行处理。在WINDOWS下,也为之提供了一系列的API,以waveIn和waveOut开头的一组API就是干这个的。<br /> 先说输入吧。常用的相关API为waveInOpen(打开一个音频输
2010-06-07 09:44:00 582
A noise reduction processor for Mobile voice communication
2010-12-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人