自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

转载 TP/FN/FP/TN(符号含义)

TP(True Positive):将正类预测为正类(的数目),真实为0,预测也为0;FN(False Negative):将正类预测为负类(的数目),真实为0,预测为1;FP(False Positive):将负类预测为正类(的数目), 真实为1,预测为0;TN(True Negative):将负类预测为负类(的数目),真实为1,预测也为1。...

2020-06-01 16:49:19 5002

原创 pickle json 保存python类型数据

pickle 模块可以保存任意类型的python数据,包括类变量,数组,字符等等。用法也很简单。一个简单的代码如下:import pickleclass Test(object): test1 = 'test' instance = Test()instance.test1 = 'This is a test'with open('test.pkl'...

2019-12-16 20:48:18 319

原创 Matlab OpenEXR 打开exr格式图片

使用Matlab打开EXR格式图片。在官网下载工具包,下载完毕解压后打开,包含三个文件夹:bin文件夹下包含了exe程序可以直接在Windows下打开exr格式图片,并查看。matlab文件夹下包含了Matlab用到的函数,是已经编译过的,很方便。mapObj = exrreadchannels(exr图片路径); % 返回Map对象info = exrinfo(exr图片路径); ...

2019-12-06 15:53:18 3919 1

原创 python opencv imread报错

造成cv2.imread()返回NoneType的一个问题是路径存在中文。

2019-12-05 10:36:53 695

原创 matlab 一个显示进度的小代码

for f=1:total_num cc = numel(num2str(total_num)); if (f>1); for c=1:(2*cc+3); fprintf('\b'); end; end fprintf(['%0' num2str(cc) 'd | %0' num2str(cc) 'd' ], f,total_num); if (f==tot...

2019-12-04 17:47:37 991

原创 谱减法 语音去噪

废话不多说 直接上代码,python版的import numpy as npimport librosaimport scipyfrom scipy import ioclass SpecSub(object): def __init__(self, input_wav): self.data, self.fs = librosa.load(input_w...

2019-11-26 20:23:28 1195 1

原创 pyinstaller 打包问题汇总以及解决办法

pyinstaller 使用很简单,大家无非就是用两种打包方式。pyinstaller -D xxx.py将项目打包成一个文件,或者pyinstaller -F xxx.py将项目打包成一整个exe文件,只有一个exe文件。注意:xxx.py是你项目的主程序我使用的是第一种方式,在此介绍可能遇到的问题打包过程中遇到的问题:1、UnicodeDecodeError这个问题是因为...

2019-09-24 16:20:06 4805 1

原创 python播放音频的三种方法

第一种 使用pygame模块 pygame.mixer.init() pygame.mixer.music.load(self.wav_file) pygame.mixer.music.set_volume(0.5) pygame.mixer.music.play()缺点:pygame模块播放音频时,有时候会产生失真,且无法通过修改播放器的频率来矫正音色。第二种...

2019-09-20 16:37:01 3261

原创 ubuntu 18.04 更新显卡驱动

1、去nvidia官网下载自己显卡对应的显卡驱动。可以先用nvidia-smi查看自己的显卡2、对下载的文件赋予权限chmod +x 你下载的驱动程序文件名3、禁用nouveausudo gedit /etc/modprobe.d/blacklist-nouveau.conf在文档中添加blacklist nouveauoptions nouveau modeset=0...

2019-09-17 19:50:55 2675

原创 pyuic使用

pyuic5 -o destination.py source.ui将source.ui文件转化为destination.py文件代码

2019-09-11 15:08:07 1639

原创 pycharm 没有菜单栏解决办法

1 按Ctrl + Shift + A打开“Find Action”对话框,键入“Experimental features”,然后按Enter键。2 取消linux.native.menu选项旁边的复选框,应用更改并关闭对话框。3 重启PyCharm。...

2019-09-03 20:55:03 10645 6

原创 PyAudio [Errno -9981] Input overflowed错误

data = stream.read(CHUNK, exception_on_overflow = False)只需要设置关键字 **exception_on_overflow = False**即可

2019-09-03 20:29:52 2597 1

原创 如何利用GMM做声纹识别

声纹识别分为文本相关的和文本不相关两种,文本相关就是指说话人需要说出特定的语句才能达到识别效果,反之则不需要。而GMM就是一种文本不相关的声纹识别算法。那么GMM是如何识别声纹特征的呢?以下是论文Robust Text-Independent Speaker Identification Using Gaussian Mixture Speaker Models里面的算法简介截图:...

2019-08-21 09:47:27 2103 1

原创 python 中的u,r,b简介

u/U:表示unicode字符串不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。建议所有编码方式采用utf8r/R:非转义的原始字符串与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些,反斜杠加上对应字母,表示...

2019-08-19 20:29:11 231

原创 python 爬虫 批量下载

很多时候我们需要从网站批量下载图片、文件等数据。这个时候可以用python的爬虫功能。本文实现一种从网站批量下载.mat数据格式的代码:import reimport urllibimport sysfrom tqdm import tqdm#获取页面源码def getHtml(url): page = urllib.request.urlopen(url) # 打开页...

2019-08-19 20:26:58 1778 1

原创 tensorflow 1.14下keras的一个BUG AttributeError: 'TFOptimizer' object has no attribute 'lr'

在写CNN网络的时候使用keras框架可以更加简单、方便。而tensorflow也集合了keras模块,但似乎两者之间还有一点不兼容的部分。keras框架下我们可以利用各种call_back函数来做很多事,比如动态调整学习率,用到的函数为 keras.callbacks.ModelCheckpoint ,该函数在模型训练的时候可以在loss不再收敛时,调小学习率。但此时如果我们使用tensorf...

2019-08-18 19:35:46 2839

原创 声谱特征提取与恢复

def get_spectrograms(fpath): '''Returns normalized log(melspectrogram) and log(magnitude) from `sound_file`. Args: sound_file: A string. The full path of a sound file. Returns: mel...

2019-06-10 15:19:27 1721

原创 基于GMM的声纹识别———Matlab实现

本项目实现需要voicebox模块,附网址:http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html1、特征提取声纹识别中常用到的特征主要有MFCC、和LPC。本文采取的MFCC特征。 function [ mfcc_feature ] = get_features( voice_data, fs )%GET_FEATURES ...

2019-05-26 15:54:19 6729 29

原创 语音合成

利用噪声和纯净语音合成带特定噪声的语音数据。例如:将说话的声音和风声混合在一起,产生带有风声的语音数据。信噪比计算公式:SNR=10⋅log10pspn SNR=10\cdot log_{10} \frac{p_s}{p_n} SNR=10⋅log10​pn​ps​​ps:p_s:ps​:信号能量pn:p_n:pn​:噪声能量def ge_NoiseData(clean_dat...

2019-05-15 15:20:11 934 1

原创 speaker recognition 声纹识别

1.语音信号语音信号是一个在时域上波动的一维信号,如下图所示:常见的语音信号模型有Autoregressive Model(自回归模型)、Sinusoidal + Residual model(正弦加噪模型)。一种更加被广泛认可的模型认为语音信号等效于一个时变滤波器对一系列脉冲信号的处理造成。脉冲信号主要受说话人的音色影响,时变滤波器主要受说话人发音内容影响(如,清音,浊音等)影响。当然,以及...

2019-05-05 11:21:12 1772

原创 python实现图像旋转

本次介绍如何实现图像的左旋和右旋。import numpy as npimg = np.random.randint(0,255, size = (5,5))def rotate(data, ori = 'left'): if ori == 'left': data = list(map(list,zip(*data)))[::-1] else: ...

2019-04-15 13:20:19 4915

原创 python 并行处理介绍

1.GIL介绍:GIL(Global Interpreter Lock)又称全局解释器锁,是在CPython解释器下的一个独有问题(该问题只针对CPython,其他解释器下并没有)。在CPython解释器下处理多线程问题时,每个线程在执行时候都需要先获取GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有一个线程使用CPU,也就是说多线程并不是真正意义上的同时执行。2.multipro...

2019-04-07 21:30:02 1694

原创 清华源镜像使用

清华源镜像解决了pip安装速度慢的问题。在使用pip的时候只需在pip后加-i https://pypi.tuna.tsinghua.edu.cn/simple 即可。例如:pip -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow...

2019-03-28 19:05:25 13712 3

转载 anconda 虚环境的使用

1. 虚拟环境的创建conda create -n name(你的虚拟环境的名称) python=X.X(2.7、3.6等)2.激活、关闭虚拟环境Linux下:source activate name(你的虚拟环境的名称)source deactivate3.列出已有的虚拟环境conda env list (列出所有的环境)4.管理虚环境(删除环境,以及在当前虚拟环境下安装新...

2019-03-28 17:39:14 677

原创 均匀随机数的产生

1.线性同余法线性同余法可以用来产生【0,1】之间的均匀随机数,公式如下:xn=(axn−1+c)mod(M)rn=xn/Mx0 x_{n} = (ax_{n-1} + c)mod(M) \\r_{n} = x_{n}/M \\ x_{0}xn​=(axn−1​+c)mod(M)rn​=xn​/Mx0​其中, MMM ,aaa,ccc,xnx_{n}xn​均为非负整数,则产生的 rn...

2019-03-24 15:32:45 2621 1

原创 python 递归算法应用

1.利用递归求序列S的最大值def search_max(S, n): ''' S:序列 n:序列长度 ''' if n == 1: return S[n-1] else: max_s = search_max(S, n-1) if max_s > S[n-1]: re...

2019-03-14 21:25:59 296

转载 windows下 安装pyaudio

pyaudio是一款可以让python进行语音输入的安装库,但安装时需要预先portaudio c++模块,该模块的安装对于C++小白来说非常难,安装时时出现各种错误。但是在使用conda install pyaudio命令后就会自动化配置环境,避免了pip install的各种问题。...

2019-03-12 10:14:43 3348 2

原创 pyaudio保存wav音频文件

在介绍前,我们有必要先明确语音信号的几个参数信息。采样频率 rate:每秒采几个点,原始语音信号为连续信号,在一秒的波形上采的点越多,保真性就越高。采样位数 format:即采样值的编码位数,计算机存储信息都在用二进制编码,位数越多,保真性越高。一般为8bit,16bit。码率 比特率:即每秒传输的数据量。pyaudio 模块保存.wav音频文件。import pyaudioimpor...

2019-03-12 10:10:02 3275

原创 hdf5storage读取 .h5文件

读取.h5文件时,常用的是h5py模块,但该模块存在一些缺点,就是在python中,使用h5py读取的数据会对原始数据产生类似于转置等操作,在使用过程中带来诸多不便。 而hdf5storage模块可以完全避免这种问题。hdf5storage的使用非常简单,示例如下:import hdf5storage as hdf5import numpy as npdata1 = np.random...

2019-02-21 16:17:45 3124

原创 ubuntu 修改root权限的文件

ubuntu系统下修改root权限文件ubuntu系统下我们常常需要修改 /etc 文件下的文件,一般方法我们需要切换root账户。但我们可以利用chmod命令。chmod命令可以用来修改文件或文件夹的读写权限。命令:sudo chmod 777 XXX可以使文件XXX让所有人有权限可以读写,从而更改文件内容。...

2019-01-18 17:14:12 6218

原创 print语句用法

python3 print语句两种用法第一种:需要指定输出数据的数据类型例如:print('数据:%.2f, 字符:%s'%(0.1234,'1234'))输出:数据:0.12, 字符:1234保留两位小数,之前的描述与之后的数据用**%**隔开。第二种不需要指定数据类型,使用***str.format()***函数例如:print('float: {0:.2f}, st...

2019-01-18 17:04:21 9083

原创 python查找元素

python实现数组元素的查找对于数组我们通常需要找到特定元素的位置,本次主要用到的函数为numpy模块下的nonzero函数。代码示例:import numpy as npdata = np.array([[1, 2, 3, 4], [5, 6 , 7, 1]])site = np.transpose(np.nonzero(data == 1))print('data:\n{0},...

2019-01-18 17:04:09 1096

原创 tensorflow 断点续训

本次介绍如何在tensorflow框架下保存以及载入模型保存模型代码示例如下:import tensorflow as tfsaver = tf.train.Saver(max_to_keep = 2000, keep_checkpoint_every_n_hours = 1)with tf.Session() as sess: init = tf.global_variable...

2019-01-18 17:03:55 1572

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除