自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 vscode无法选择解释器

解决方法:使用另一台电脑对当前服务器进行配置,在服务器上安装的Python和Pylance插件的版本和该电脑相同,而与当前工作电脑上的Vscode本地插件的版本不同,因此导致软件找不到Python解释器的路径,将两个插件重装后同步本地和远程的插件版本号后,就可以正常使用了。使用Vscode远程登陆Linux服务器后,代码没有高亮,也无法选择python解释器。把本地的pylance和python卸载了 然后重新安装就好了。

2023-07-18 21:16:45 1471

原创 probability and statistics(7) 参数估计

参数估计参数估计(parameter estimation): 根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计点估计: 借助于总体中抽取的一个样本来估计总体的未知参数的值的问题称为参数的点估计问题构建点估计常用方法:1.矩估计法: 用样本矩估计总体矩,从而得到总体分布中参数的一种估计。它的思想实质是用样本的经验分布和样本矩去替换总体的分布和总体矩。矩估计法的优点是简单易行, 并不需要事先知道总体是什么分布。缺点是,当总体类型已知时,没有充分利用分布提供

2020-10-26 17:17:43 334

原创 probability and statistic(5) 信息量、交叉熵、香农熵、KL散度

信息量、交叉熵、香农熵、KL散度1.信息量信息量来衡量一个事件的不确定性,一个事件发生的概率越大,不确定性越小,则其携带的信息量就越小。公式:I(x)=−log2p(x)I(x) = -log_2p(x)I(x)=−log2​p(x)举个简单的例子:事件一:巴西队和西班牙队进行足球比赛,赛前预测巴西队获胜的概率是50%事件二:巴西队和洛杉矶湖人队进行足球比赛,赛前预测巴西队获胜概率99%这样我们通过信息量的计算公式得到事件二的信息量明显小于事件一,也就是事件一的不确定性很大,事件二的不确定性很

2020-10-15 13:52:52 324

原创 probility and statistic(4) gamma分布、beta分布、dirichlet分布、卡方分布、t分布

共轭分布、gamma分布、beta分布、dirichlet分布1.共轭分布在贝叶斯统计中,如果后验分布与先验分布属于同类,那我们就称它为共轭分布先验分布(prior):在没有看到观测数据时,由我们的经验给出来的参数的概率分布称为先验分布后验分布(Posterior):考虑和给出相关证据或数据后所得到的条件概率分布前一篇文章,我们讲了指数分布,他是用来描述要等到一个随机事件的发生需要多长时间,相比于指数分布,gamma分布就是指数分布的拓展,他描述的是要等到n个随机事件都发生需要多长时间...

2020-10-14 16:53:45 1934

原创 probility and stastic(3) 样本空间、随机变量、常见概率分布、独立性

样本空间、随机变量、常见概率分布、独立性样本空间我们将随机试验E的一切可能基本结果(或实验过程如取法或分配法)组成的集合称为E的样本空间,记为S。样本空间的元素,即E的每一个可能的结果,称为样本点。例如:设随机试验E为“抛一颗骰子,观察出现的点数”。那么E的样本空间 S:{1,2,3,4,5,6,}。随机变量首先我们来说变量,变量顾名思义,其实就是一个变化的量,这个变化的量的取值有可能是在一个有限集合里取值,也有可能在一个无限集合里取值,其实换句话说就是,如果一个变量有多个可能的取值,并且取得每一

2020-09-28 16:39:19 1431 1

原创 probility and statistic(1) 均值、方差、期望、协方差、相关系数

均值、期望、方差、协方差均值、方差这两个概念我们在初中就曾接触过,而期望和协方差我们可能到了大学才会接触到一、均值:均值又分为总体均值和样本均值:(1).总体均值:使用总体数据求得的均值  想必这个大家都耳熟能详,他其实反映的就是一组数据的平均值,他的公式也非常简单设一组数据为  X = (x1,x2,x3,x4,x5,……xn)那么他的均值就为 μ=∑i=1NxiN\mu = \frac{\sum_{i=1}^Nxi}{N}μ=N∑i=1N​xi​(2).样本均值:从总体数据中抽出一部分样.

2020-09-27 17:04:51 1021

原创 probility and statistic(2) 常用的相似性度量

在机器学习中,经常使用距离来计算相似性,通常距离越近,相似度就越大,今天我们就来总结一下,常用的距离计算方法:1.欧式距离(Euclidean Distance)欧式距离是我们平时使用最多的一种方法,也是非常容易理解的一种方法,源自欧式空间中两点的距离公式,是指在m维空间两点之间的真实距离,也就是通常我们所说的直线距离。在地图中,两地直接连线的距离就是欧式距离二维空间中欧氏距离计算公式:设两点分别为a(x1,y1),b(x2,y2)d1,2=(x1−x2)2+(y1−y2)2d_{1,2}=\sq

2020-09-25 18:44:33 874

原创 从0开始学nlp(开篇)

从0开始学nlp今天在知乎看到一片nlp如何学的文章 这里一位韩国的小伙伴做的一份思维导图,由于之前学的东西太散了,所以准备把这些内容都串起来,同时不会的再深入学习,尽量每周更新三篇,按照文章的顺序总结,一些容易的知识的话就几个知识点一起记录,希望可以坚持到底,如果大家喜欢,也欢迎大家收藏、关注。...

2020-09-25 17:04:03 308

原创 winscp从windows向ubuntu传文件

首先下载winscp,我从这里下载的pc.qq.com/detail/11/detail_2331.html,正常安装就可以随后我们打开winscp,这时候如果直接链接很可能出现链接被拒绝的情况,这是因为我们在Ubuntu中要先安装ssh服务,我们可以通过以下命令来检查我们是否安装ssh localhost如果出现ssh:connect to host localhost port 22:connection refused 则代表我们没有安装ssh我们就可以通过以下命令来安装sudo apt-

2020-09-21 15:29:07 509

原创 montreal英文音素级别强制对齐

之前测试了aeneas的强制对齐,现在再使用Montreal Force Align完成强制对齐任务首先是Montreal Force Align的安装,直接下载即可github.com/MontrealCorpusTools/Montreal-Forced-Aligner/releases/download/v1.1.0-beta.2/montreal-forced-aligner_win64.zip"下载之后文件夹里会有bin和pretrained_models两个文件夹,然后我们cd到mont

2020-09-07 14:06:05 1966

原创 python创建虚拟环境

近日, 考虑我在使用python的时候跑模型的时候经常需要更改tensorflow和pytorch的版本,不停的更换版本很麻烦,所以就开始通过创建虚拟环境的方法来就可以很好的解决这个问题下面就来简单记录一下创建虚拟环境的流程:首先我们需要安装virtualenv这个库:打开cmd命令通过pip就可以安装pip install virtualenv然后就是创建虚拟环境先cd到虚拟环境要安装到的目录virtualenv -p python解释器的位置 虚拟环境的名称 `这样我们就在当前目

2020-05-22 11:43:24 129

原创 nktk.download()出现getaddrinfo failed

最近在下载nltk语料库出现getaddrinfo failed原因是因为server index 这里地址错误了 我们改成www.nltk.org/nltk_data 就可以啦

2020-04-16 18:01:19 2630

原创 kaldi tutorial

https://eleanorchodroff.com/tutorial/kaldi/index.html

2020-03-10 15:31:55 137

原创 pytorch 加载模型后测试的同一条数据得到的结果不一样

我们可以考虑是否使用了dropout如果使用了dropout则可能导致对同一条数据测试结果不一样的情况我们可以将模型切换到eval模式 使用model.eval()就可以啦...

2020-01-08 11:11:33 4235 8

原创 出现wave.Error: unknown format: 3解决方法

通常出现这种情况 我们下载sox并配置环境变量执行sox 1.wav -b 16 -e signed-integer 11.wav这样就ok啦如果我们想用批量的生成我们可以通过写个shell脚本for file in `ls "D:\\english_rec\\code_generate\\ori"`do p="D:\\english_rec\\code_generat...

2019-12-18 10:51:40 7673

原创 python argparse用法

import argparseparser = argparse.ArgumentParser()parser.add_argument("-f", "--wav_file", help="audio_file")parser.add_argument("-t", "--txt_file", help="txt_file")parser.add_argument("-s","--seco...

2019-12-10 11:14:25 79

原创 aeneas使用总结

aeneas是一个主要用于文本和语音对齐的工具 主要是对句子级别和单词级别的语音要使用这个包 我们简便的方法就是 通过https://github.com/sillsdev/aeneas-installer/releases来一键下载安装安装完之后我们就通过python -m aeneas.tools.execute_task.\\audios\\good_morning_...

2019-12-10 10:44:33 1495 2

原创 python 使用speech recognize 语音识别

import speech_recognition as sr# AUDIO_FILE = r"C:\RAZ绘本JPG版+音频MP3\a\a\All Kinds of Faces\raz_allkindsfaces_title_text.mp3"AUDIO_FILE = r"C:\wav_data\raz_atatouchtank_lh21_p4_text.wav"r = sr.Recog...

2019-11-08 14:42:37 889

原创 tts model summary

http://www.erogol.com/text-speech-deep-learning-architectures/

2019-11-05 10:44:20 101

原创 用于python包下载的网站

一个python库下载网站,可以先下载到本地,然后进入对应文件夹,使用pip install whl文件 ,就能安装了。网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

2019-10-26 13:39:00 963

原创 用python来录制扬声器的发音

我们通过pyaudio、sounddevice录制语音,一般都是录制的麦克风语音系统默认的声音输入设备是麦克风,如果需要录制系统声音则需要将声音设备切换成立体声混音。有可能不存在立体声混音这个选项我们通过打印sd.query_devices()显示系统所有的设备我们通过sd.default.device[0] = 2将默认设备设置为立体声混音如果立体声混音不存在我...

2019-10-23 13:15:55 2238 4

原创 语音调节 变调不变速

前面记录了语音变速不变调,之后我又把变调不变速实现了一下这里先说一下大概流程,类似于变速不变调,首先函数传入三个值,分别为调节系数、语音的pcm数据、基因周期标记点首先说升高频率: 降低频率我们可以通过先增加周期、再降采样、降低频率:先减少周期、然后两个点之间加平均值def pitch_adjust(cor, wave_data, point): wave_data...

2019-10-21 15:04:39 1460 5

原创 语音调节 变速不变调

这里贴出了 语音变速的代码首先我们通过计算周期、然后进行标记,这两点在我的上一篇文章已经说过这里讲一下得到基音标记点后预处理的内容这里 首先对相邻比较近的点进行删除、我设置的阈值为 计算出的周期的最小值,如果两个相邻的小于这个阈值 则将后面的删除接下来处理清音段、由于之前清音段部分没有计算周期 选择了跳过、所以相邻的基因点之间差距较大,这时我们可以按照前一个周期对差距较大的点进行...

2019-10-21 13:10:31 1382

原创 语音语速调节 变速不变调

这里我写了一下语音变速不变调的代码首先说一下这个原理,如果我们直接通过在两个点中间添加点或减少点的,这样虽然语速是变化了,但同时语调也发生了变化,所以我们需要通过插入或删除基音周期片段的方式来改变语速,首先我们需要获取每一帧的基音周期,随后我们做基音周期的标记,这些在我之前的文章里面有相应的方法和代码,当我们获取到基音周期的标记点,我们就可以周期性的添加波形或删减波形,下面贴出一下我的代码...

2019-10-21 10:15:17 2047 4

原创 计算能量 与 过零率

能量的计算def calEnergy(wave_data, sample): energy = [] sum = 0 start = 0 end = int(sample * 0.025) move = 0.4 * end for i in range(int(np.ceil((len(wave_data) - end) / move) + 1...

2019-10-18 10:12:55 447

原创 关于波形拼接中音量调节问题

下面是波形拼接中音量调节的代码def adjust(file,volumn): wa = get_wave_data(file)[0] sam = get_wave_data(file)[1] bili = 1000/(volumn+1) if bili < 1: wa_new = list((wa * bili*3).astype(in...

2019-10-18 09:55:03 156

原创 使用python进行基音周期的计算

下面贴出一下我自己使用的基音周期的提取方法:首先我们设置帧长pe、帧移step(这里我使用的采样率为16000),由于基音频率一般在80hz-500hz之间,所以一个周期的长度在2ms-12.5ms之间, 而我们计算基因周期至少需要两个周期, 这里我就选择了25ms的帧长,10ms的帧移,也就是400采样点,160的重叠然后我通过遍历的方式依次取到每一帧的采样点,得到data, 因为...

2019-10-12 14:02:28 2712

原创 主定理在算法复杂度中应用

如果 对于一个求时间复杂度的式子满足递推式 T(n) = aT(n/b) + f(n) 其中a >=1 ,b>1则我们可以通过判断 对某个常数,有,则 若,则 ...

2019-08-10 22:19:58 192

原创 计算机视觉-opencv绘图

画直线:cv2.line(img,start,end,color,thickness,linetype)img:代表要绘制的图像start:点的起始位置,是一个元组end:点的终止位置,是一个元组color:颜色(bgr的顺序,是一个元组,例如:(255,0,0)代表蓝色)thickness:线条宽度,默认为1linetype:线条的类型import numpy ...

2019-06-09 21:58:33 139

原创 计算机视觉-opencv读取图像、视频以及显示保存

读入图像:cv.imread() import cv2 as cv cv.imread("d:/1.png",0)第一个参数为图片的路径第二个参数为图片读取方式(0代表灰色,1代表彩色)图像显示:cv.imshow() ` cv.imshow("input_image",src) cv.waitkey(0) cv.destroyAl...

2019-06-08 18:08:30 606

原创 计算机视觉—图像直方图与直方图均衡化

图像直方图: 一副灰度图像是由不同的灰度的像素值组成的,而图像中的灰度值的分布则反映了一定的图像特征,即图像亮度特征,如果直方图的值偏向于0,则表示该图像亮度偏暗,如果直方图的值偏向于255(我们通常进行归一化,将图像的像素值设置在[0,1]区间内,则表示该图像亮度偏亮,我们画出的直方图横坐标表示灰度值,纵坐标表示该灰度值出现的次数 下面我们来分析一张图像...

2019-06-03 15:05:54 1400

原创 监督学习和非监督学习

监督学习:              用已知某种特性的样本作为训练集,以建立一个数学模型,再用建立的模型去预测未知样本,该方法称之为监督学习              总的来说 就是从标签化的训练数据集中推断出模型的机器学习任务无监督学习:              无监督学习的训练集没有人为标记的结果,学习模型是为了推断出数据的一些内在结构半监督学习:          ...

2019-01-18 23:41:53 496

原创 数据预处理时的一些基本操作

1、删除某一列:            df.drop(列名,axis = 1(删除列),inplace = True(对原dataframe进行操作)2、判断哪一列有空值:            df.isnull().any()           如果有空值 则该列返回True,否则返回False3、删除值含空的数据            df.dropna()   ...

2019-01-15 08:26:06 2974

原创 numpy中一些常用的随机数生成

import numpy as npnp.random.randint(low,high,size) 生成最小值为low,最大值为high,形状为size的随机整数np.random.randn(size) 生成形状为size的标准正态分布随机数组np.random.normal(loc = 0.0 , scale = 1.0,size) 生成以loc为均值,scale为方差的 形状为...

2019-01-11 23:26:38 199

原创 简述数据处理中索引的使用方法 (loc,iloc)

索引值指的是自己定义的index, 索引下表代表系统默认的索引Series:            对于只有一层索引的series:                                 s[索引值] 获取到该索引值下的数据                                 s[[索引值1,索引值2]] 获取索引值1和索引值2对应的数据         ...

2019-01-11 17:13:15 2656

原创 简述numpy.nan和None的区别

丢失的数据类型主要有None 和 np.nannp.nan是一个float类型的数据 None是一个NoneType类型1、在ndarray中显示时 np.nan会显示nan,如果进行计算 结果会显示为NAN                               None显示为None   并且对象为object类型,如果进行计算 结果会报错                 ...

2019-01-11 12:49:25 23005

原创 响应报文utf-8为什么设置了charset=utf-8,还编码错误?

响应报文utf-8为什么设置了charset=utf-8,还编码错误?Content-Type:text/html;charset=utf-8/r/n这里要注意格式 习惯了等号前后加空格,这可能会导致使用utf-8编码时出现错误,如果使用utf-8编码出现错误时 一定要检查响应头的格式charset=utf-8等号前后不要加空格...

2018-11-20 12:49:13 6280 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除