学习笔记
Grace_yanyanyan
这个作者很懒,什么都没留下…
展开
-
Library not loaded: @loader_path/libmex.dylib
这两天要跑一个asvspoof2017的baseline,matlab的代码,可是出现一个动态库无法加载的问题,搞了好久还请了高人帮忙,终于解决了我自己的问题忘了截图了,说mexmaci64这个文件无效,跟下面差不多:问题如下:Library not loaded: @loader_path/libmex.dylibReferenced from:/Users/usr/Documents/MATLAB/SFMedu2/denseMatch/priority_queue_1.0/pq_create.原创 2020-06-25 11:52:30 · 1654 阅读 · 1 评论 -
20200621--learning-to-fool-the-speaker-recognition-master 实验记录
出错1:RuntimeError: Detected that PyTorch and torchvision were compiled with different CUDA versions. PyTorch has CUDA Version=10.2 and torchvision has CUDA Version=10.1. Please reinstall the torchvision that matches your PyTorch install.解决办法:pip install t原创 2020-06-22 23:56:50 · 622 阅读 · 0 评论 -
linux如何只复制目录结构而不复制数据
find . -type d -exec mkdir -p /data/datasets/musan1/{} ;在当前目录下找类型为d的文件(即目录类型),然后执行后面的操作。当前目录是你要copy的文件夹,-p后面接的目的文件夹...原创 2020-03-27 15:07:02 · 4640 阅读 · 0 评论 -
探索说话人识别数据集时要注意的问题
Note:In the speaker id community the words “train”, “test” and “development”are used in a different sense from in the speech recognition community. Inspeaker-id land, the “development” data is the...原创 2019-12-20 17:09:11 · 385 阅读 · 0 评论 -
更换jupyter notebook的主题
参考:https://www.itcodemonkey.com/article/8938.html原文中只有oceans16 这个主题的效果,想知道其它主题的效果么?chesterish:grade3:gruvboxd:gruvboxl:monokai:onedork:solarizedd:solarizedl:...原创 2019-12-19 19:54:45 · 112 阅读 · 0 评论 -
如何将jupyter notebook的ipynb文件转换成pdf?
参考:https://www.zhihu.com/question/264356675经多种方法实验比较,下面的最靠谱将 ipynb 文件下载为 md 格式文件安装 Typora使用 Typora 打开 md 文件文件-导出-PDF...转载 2019-12-19 13:04:10 · 770 阅读 · 0 评论 -
两个t-sne画图的小例子
第一个:import numpy as npimport matplotlib.pyplot as pltfrom sklearn import manifold, datasetsdigits = datasets.load_digits(n_class=6)# 这里只提取了0-5这6个数字X, y = digits.data, digits.targetn_samples, n...转载 2019-12-19 10:54:58 · 4193 阅读 · 0 评论 -
c++学习笔记
全部来源于菜鸟教程https://www.runoob.com/cplusplus/cpp-tutorial.html对象是类的实例。三字符组就是用于表示另一个字符的三个字符序列,又称为三字符序列。三字符序列总是以两个问号开头。以前为了表示键盘上没有的字符,这是必不可少的一种方法。三字符序列可以出现在任何地方,包括字符串、字符序列、注释和预处理指令/* 这是注释 *//* C++ 注...转载 2019-12-13 14:43:46 · 152 阅读 · 0 评论 -
有关FA,FR,EER,DET,P,R,ROC等的一些思考
原创 2019-12-13 13:24:04 · 1212 阅读 · 1 评论 -
LPC--线性预测编码
线性预测编码(英语:LPC, Linear predictive coding)是主要用于音频信号处理与语音处理中根据线性预测模型的信息用压缩形式表示数字语音信号谱包络(spectral envelope)的工具。它是最有效的语音分析技术之一,也是低位速下编码方法高质量语音最有用的方法之一,它能够提供非常精确的语音参数预测。线性预测编码的基本思想是:“一个语音取样的现在值可以用若干个语音取样过去...翻译 2019-12-11 12:32:07 · 5550 阅读 · 0 评论 -
穷学生如何免费申请LDC收费的语料库
https://www.ldc.upenn.edu/language-resources/data/data-scholarshipsData ScholarshipsImportant DatesSubmission Deadline for the Spring 2020 semester: January 15, 2020Winner Notification: RollingPr...转载 2019-12-06 08:59:34 · 2423 阅读 · 3 评论 -
强烈推荐----现代机器学习技术导论--清华大学王东
http://166.111.134.19:7777/mlbook/2016年7月到8月,王东老师在CSLT组织了一次关于机器学习的内部暑期研讨班。主要目的不是细致 讨论各种具体算法,而是将各种看似高深的方法有机组织起来,告诉学生们每种方法 的基本思路、基本用法及与其它技术的关联,帮助 其走入机器学习的宏伟殿堂。除了王东老师讲以外,还有冯洋、王彩霞、王卯宁 三位老师,分别讲述图模型、核方法和遗...原创 2019-11-29 14:39:54 · 1211 阅读 · 1 评论 -
说话人识别参考书--待更新
韩纪庆,2013,第二版,语音信号处理,第7章,说话人识别,大概40页Fundamentals.of.Speaker.Recognition,.Homayoon.Beigi,.Springer,.2011,900多页GMM-UBM,I-vector,PLDA,d-vector,x-vector等重要理论的提出论文kaldi中aishell/v1,sre16的run.sh...原创 2019-11-29 14:19:49 · 250 阅读 · 0 评论 -
语音小朋友常用网址---待更新
去哪里学kaldi:kaldi:http://kaldi-asr.org/doc/tutorial.html去哪里下载数据:nist:https://www.nist.gov/itlLDC:去哪里搜论文:icassp :https://blog.csdn.net/yj13811596648/article/details/90477366interspeech :https://bl...原创 2019-10-30 14:11:18 · 451 阅读 · 0 评论 -
李明老师关于说话人识别和语种识别的总结
李明老师 个人主页:https://scholars.duke.edu/person/MingLi李明老师的google scholar 地址:https://scholar.google.com/citations?hl=en&user=C_JTsqgAAAAJ&view_op=list_works&sortby=pubdate...原创 2019-10-30 14:05:44 · 522 阅读 · 0 评论 -
ubuntu 16.04.4 LTS 中文乱码问题解决记录
首先添加源,https://blog.csdn.net/weixin_44354586/article/details/89392951才发现原来我只有阿里云的源,以前好多包都安装不成功可能跟这个有关然后各种升级一下sudo apt-get updatesudo apt upgrade然后跟着这个链接:Ubuntu修改locale从而修改语言环境https://blog.csdn.ne...原创 2019-10-23 12:58:09 · 896 阅读 · 0 评论 -
终于有人把机器学习中的评价指标讲清楚了
终于有人把机器学习中的评价指标讲清楚了https://mp.weixin.qq.com/s/EZw12p5qu_yYbyHfA55sgQ训练与识别正例与负例混淆矩阵,这个没有说清楚模型性能指标正确率(Accuracy)错误率(Error-rate)精度(Precision)召回率(Recall)精度-召回率曲线(PR曲线)AP(Average Precision)值mAP(...转载 2019-10-14 10:07:19 · 600 阅读 · 0 评论 -
Mac 安装 Matlab error -8
我是根据这个网页装的matlab,https://blog.csdn.net/Richard__Ting/article/details/81916856但报错error -8,将/Applications/MATLAB_R2018a.app/bin/maci64/matlab_startup_plugins/lmgrimpl/文件夹下原本的 libmwlmgrimpl.dylib删掉,再将...原创 2018-12-30 18:58:40 · 1760 阅读 · 0 评论 -
20190516
以下为阅读这个网站的笔记One-Hot编码,又称为一位有效编码,独热编码的翻译实在是太难听也难懂了先提下数据特征表示问题。数据表示是机器学习的核心问题,在过去的Machine Learning阶段,大量兴起特征工程,人工设计大量的特征解决数据的有效表示问题。而到了Deep Learning,想都别想,end-2-end,一步到位,hyper-parameter自动帮你选择寻找关键的特征参数。...原创 2019-05-23 10:44:40 · 162 阅读 · 0 评论 -
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
这个错误的意思就是说你装cuda9.0了么?9.1都不行啊,装完环境变量改了么?改了就不会报错了参考:https://blog.csdn.net/wanzhen4330/article/details/81704474原创 2019-05-30 18:38:27 · 106 阅读 · 0 评论 -
ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory
这个错误的意思就是:你装cudnn7.0了么?参考:https://blog.csdn.net/wanzhen4330/article/details/81704474原创 2019-05-30 18:40:00 · 689 阅读 · 0 评论 -
20180528 timit数据集下载地址
可以从下面链接下载timit数据集的一部分,总共应该400多兆,这里只有40多兆,只有一部分也可以。我们可以看看格式。这里只有38个说话人,也就是38个文件夹。https://download.csdn.net/download/weixin_41864878/10585377TIMIT全称The DARPA TIMIT Acoustic-Phonetic Continuous Speech ...原创 2019-05-28 19:01:02 · 6499 阅读 · 4 评论 -
20190528 Python读取WAV文件的几种方式整理
本来想自己整理一个python对wav文件的处理方法的,一搜才发现已经有人做了,那就先把连接存在这里,有时间自己再添加整理吧。pysoundfilehttps://pysoundfile.readthedocs.io/en/0.9.0/librosahttps://blog.csdn.net/qq_40168949/article/details/80976559scipyhttps:...原创 2019-06-03 15:56:58 · 1397 阅读 · 0 评论 -
20190523 语音合成
paperswithcodehttps://paperswithcode.com/task/speech-synthesis20个令人惊叹的深度学习应用(Demo+Paper+Code)https://www.cnblogs.com/czaoth/p/6755609.html语音合成的有趣历史:How Speech Synthesizers Workhttps://www.youtube...原创 2019-06-03 15:57:19 · 346 阅读 · 0 评论 -
20190527
我们在学习tensorflow的时候知道,任何一个张量都具有三个属性,名字name,维度shape,类型type。tensorflow的计算都是通过计算图来进行的,计算图的每一个节点代表了一个计算,计算的结果就保存在张量之中,所以张量和节点代表的计算结果是对应的,所以张量的命名就可以通过node:src_putput的形式来命名。如:add:0就说明这个张量是计算节点add输出的第一个结果,编号...原创 2019-06-03 15:57:42 · 122 阅读 · 0 评论 -
20190530
深度学习服务器环境配置: Ubuntu17.04+Nvidia GTX 1080+CUDA 9.0+cuDNN 7.0+TensorFlow 1.3http://www.52nlp.cn/深度学习服务器环境配置-ubuntu17-04-nvidia-gtx-1080-cuda-9-0-cudnn-7-0-tensorflow-1-3解压 .solitairetheme8 文件https://...原创 2019-06-03 15:58:05 · 141 阅读 · 0 评论 -
如何用声音证明你是你
https://www.bilibili.com/video/av39088758如何用声音证明你是你?未见其人,先闻其声。人们可以通过声音判断对方是谁,声音同样可以被用来证明“你是你”。和面容,指纹一样,人类的发声器官千差万别,发出的声音也不尽相同。人声的这种特质被称为“声纹”,可“声纹”究竟是声音的哪部分?以苹果为例 ,中气十足、轻声细语这样人耳能分辨出的特征就像是苹果的颜色和形状,机器学...翻译 2019-06-03 15:58:46 · 253 阅读 · 0 评论 -
20190603--Talk is cheap,show me your code!
今天终于跑通了tensorflow语音识别的官方例子,就是这个:https://blog.csdn.net/yj13811596648/article/details/90637656原来,之前是cuda没装好,gpu的版本和cuda的版本也没有对上,cudnn也没装,后来阴差阳错弄好了以后我就想着能不能再试试。结果改好目录,直接运行train.py就开始训练了。原来是十个命令,18000步,...原创 2019-06-03 20:59:17 · 537 阅读 · 0 评论 -
20190605
Jupyter Notebook主题字体设置及自动代码补全https://www.cnblogs.com/qiuxirufeng/p/9609031.html秋观天象: 一段声音的旅程(1)----(19)在微信公众号搜索中搜:声音信号处理根据下面网址给ubuntu安装curlhttps://www.cnblogs.com/heqiyoujing/p/9432091.htmlCURL是...原创 2019-06-10 13:11:11 · 120 阅读 · 0 评论 -
20190603 莫烦--pytorch-简单CNN完整代码
原地址:https://morvanzhou.github.io/tutorials/machine-learning/torch/4-01-CNN/"""View more, visit my tutorial page: https://morvanzhou.github.io/tutorials/My Youtube Channel: https://www.youtube.com/u...转载 2019-06-04 10:33:31 · 3291 阅读 · 0 评论 -
20190604
TF-调整矩阵维度 tf.reshape 介绍函数原型为def reshape(tensor, shape, name=None)第1个参数为被调整维度的张量。第2个参数为要调整为的形状。返回一个shape形状的新tensor注意shape里最多有一个维度的值可以填写为-1,表示自动计算此维度。自编码是啥意思?如果你了解 PCA 主成分分析, 再提取主要特征时, 自编码和它一样,甚...原创 2019-06-04 21:02:53 · 133 阅读 · 0 评论 -
20190624 distill
今天发现了一个网站:https://distill.pub/Machine Learning ResearchShould Be Clear, Dynamic and Vivid.Distill Is Here to Help.一篇讲解CTC原理的特别好的文章:https://distill.pub/2017/ctc/有时间最好再看一遍,翻译一下最开始是想看这个的TensorFlow...原创 2019-06-24 18:24:57 · 316 阅读 · 0 评论 -
NetVLAD: CNN Architecture for Weakly Supervised Place Recognition
NetVLAD: CNN Architecture for Weakly Supervised Place RecognitionNetVLAD:用于弱监督位置识别的CNN架构https://ieeexplore.ieee.org/document/7937898Abstract:文摘:We tackle the problem of large scale visual place r...翻译 2019-07-16 16:08:42 · 530 阅读 · 0 评论 -
关于声纹识别数据集VoxCeleb2下载问题--
voxceleb2 下载:基本就是参考下面这篇:https://blog.csdn.net/weixin_38858860/article/details/83997952可以在linux或者mac上直接用下面命令下载:(这个是下载的vox2的audio部分,声纹识别用的)用户名和密码需要自己去申请,很容易。剩下的就看网速了。建议用自己家宽带下载。wget http://www.ro...原创 2019-07-29 09:45:02 · 5670 阅读 · 24 评论 -
2019020
中国科学技术大学(简称“中科大”)在安徽合肥,官网中国科学院大学(简称“国科大”),官网中国科学院大学和中国科学技术大学,到底是什么关系?中国科学院大学(简称“国科大”),2014年才开始招收本科生。截至2018年底,学校由京内四个校区(玉泉路、中关村、奥运村、雁栖湖)、京外五个教育基地(上海、武汉、广州、成都、兰州)和分布在全国的116个培养单位组成。中国科学院,官网全院共拥有12个...原创 2019-05-23 10:44:10 · 104 阅读 · 0 评论 -
20190509
Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition论文下载地址论文阅读笔记:The Linguistic Data Consortium (LDC) is an open consortium of universities, libraries, corporations and government r...原创 2019-05-23 10:43:29 · 755 阅读 · 0 评论 -
什么是模拟信号?数字信号?区别是什么?它们又是如何完成转换的?
https://www.bilibili.com/video/av23733287?t=228大家好,通过上期视频,我们已经知道无线电波就是用来传输数据的,但在传输数据之前,我们的手机或者电脑之类的电子设备往往都要先进行一个模拟信号转数字信号的过程。所以这期视频我们来了解一下模拟信号和数字信号之间的区别,他们之间又是如何转换的。模拟信号简单地说就是用电信号去模拟出其它的信号,比如用电信号模拟出...翻译 2019-03-04 21:04:10 · 21317 阅读 · 2 评论 -
无线电波是怎么产生的
https://www.bilibili.com/video/av23448535?t=165大家好,现在无线通信越来越发达,我们会比较好奇,我们的手机,收音机,为什么在隔空的情况下,就能够收到千里之外的声音、图片、视频之类的东西。让我们先来了解下无线电波是什么,并且是怎么产生的。我们家里的电视机顶盒或者路由器之类的设备,都需要接到运营商的网线才可以正常工作。网线就是用来传输数据的。但是像雷达...翻译 2019-03-04 20:33:00 · 8281 阅读 · 0 评论 -
什么是调制?FM和AM有什么区别?
https://www.bilibili.com/video/av24094329?t=137大家好,上次视频我们已经了解了模拟信号和数字信号,但我们的设备在得到了模拟信号和数字信号之后还不能直接把信号发出去,因为他们属于低频信号,很难直接进行远距离的传输。就像我们站在外面大喊一声,这个声音可能顶多传个一两公里就没有了。为了让信号传得更远,在对这些信号进行传输之前 ,还要对这些信号进行调制。我们...翻译 2019-03-04 20:14:58 · 28655 阅读 · 0 评论 -
计算机的0和1是怎么变成我们屏幕上看到的图片、视频和声音的
https://www.bilibili.com/video/av19369528大家好,我们都知道,对于计算机来讲所有的东西都是由0 和1 组成的,所以这期视频我们来了解下这堆0 和1 是怎么变成我们看到的文字、图片、视频还有声音的。其实这堆0和1和我们的语言是一个道理,比如说,我们生活中的一个苹果,在中文里面是用“苹果”来表示的,英文是用“apple”来表示的,虽然他们的表示方式不一样,但...翻译 2019-03-04 19:57:44 · 21405 阅读 · 0 评论