自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(103)
  • 资源 (7)
  • 收藏
  • 关注

原创 transformer和CNN各种结合方式相关的文章(不完全统计)

transformer和CNN各种结合方式相关的文章(不完全统计)NLP领域相关Conformer: Convolution-augmented Transformer for Speech Recognition[2005.08100] Conformer: Convolution-augmented Transformer for Speech Recognition (arxiv.org)Lite Transformer with Long-Short Range Attention[200

2021-11-30 15:17:49 1643

原创 Ubuntu安装srim工具

Ubuntu安装srim工具第一次用srim这个工具训练ngram语言模型,安装方式有些特殊。第一步 下载源码文件访问链接http://www.speech.sri.com/projects/srilm/download.html打开网页,找到这个位置,如下图,填写姓名,组织,住址,邮箱然后就可以下载了。我下载的是1.7.3。第二步 解压文件下载好之后,放到Ubuntu服务器上,解压命令 tar -zxvf srilm-1.7.3.tar.gz第三步 检查你的Ubuntu机器型号进入到解压

2021-11-29 14:13:45 3148

原创 Improving noise robustness of contrastive speech representation learning with speech reconstruction

Improving noise robustness of contrastive speech representation learning with speech reconstruction研究机构: The Ohio State University,Microsoft Corporation文章来源:[2110.15430] Improving Noise Robustness of Contrastive Speech Representation Learning with Speech

2021-11-25 17:22:25 1726

原创 深度学习、Linux基础、语音技术等电子书籍分享,仅供学习

深度学习、Linux基础、语音技术等电子书籍分享,仅供学习即将毕业老师兄学习资源分享Linux书籍鸟哥的Linux私房菜-基础篇第四版链接:https://pan.baidu.com/s/14zOQHJb7AQgNTsa2f2jZVg提取码:x8ysLinux Shell编程从入门到精通链接:https://pan.baidu.com/s/1L-FwvVkUDgYUk53sWCuC4Q提取码:kslfC++书籍C++ Primer Plus 第六版链接:https://pan.baid

2021-11-23 15:46:57 2148

原创 JOINT UNSUPERVISED AND SUPERVISED TRAINING FOR MULTILINGUAL ASR

JOINT UNSUPERVISED AND SUPERVISED TRAINING FOR MULTILINGUAL ASR研究机构:google文章来源:[2111.08137] Joint Unsupervised and Supervised Training for Multilingual ASR (arxiv.org)研究背景自监督语音预训练模型在下游任务(如ASR)表现出很好的性能,目前的预训练方法采用2阶段式,包含pre-train和fine-tune。pre-train段主要优化

2021-11-21 17:25:40 1355

原创 interspeech2021论文集下载地址

interspeech2021论文集https://www.isca-speech.org/archive/interspeech_2021/index.html

2021-09-03 18:36:29 3451 1

原创 noise92噪声数据集官方下载地址

noise92噪声数据集官方下载地址http://spib.linse.ufsc.br/noise.html

2021-08-05 16:30:24 3078 1

原创 论文解读:HUBERT HOW MUCH CAN A BAD TEACHER BENEFIT ASR PRE-TRAINING

HUBERT HOW MUCH CAN A BAD TEACHER BENEFIT ASR PRE-TRAINING文章来源:icassp2021[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JYHYuLUO-1627824995743)(https://raw.githubusercontent.com/zqs01/figurebed/main/img/image-20210801162550871.png)]研究背景:相比于CV和NLP领域,ASR领域中自监督预训

2021-08-01 22:38:03 1110

原创 icassp2021论文集下载

icassp2021论文集链接如下:https://ieeexplore.ieee.org/xpl/conhome/9413349/proceeding

2021-06-02 23:24:49 4368 7

原创 icassp2020论文下载

icassp2020论文下载,链接:https://ieeexplore.ieee.org/xpl/conhome/9040208/proceeding会议的各个主题介绍:https://cmsworkshops.com/ICASSP2020/TechnicalProgram.asp

2020-04-24 20:28:02 5802

原创 [Python]最大间隙问题

最大间隙问题问题描述最大间隙问题是指,给定n个实数x1,x2,...,xnx_1, x_2,...,x_nx1​,x2​,...,xn​,求这n个数在实轴上相邻2个数之间的最大差值。假设对任何实数的下取整函数耗时O(1)O(1)O(1),设计最大间隙问题的线性时间算法。解题思路第一种方法先对n个数进行从小到大排序,然后依次计算相邻两个数之间的距离。采用这种方法,最优排序方法的计算复杂度为...

2020-04-01 22:05:52 1784

原创 Facebook发布多语种语音-文本翻译语料库CoVoST

Facebook发布多语种语音-文本翻译语料库CoVoST,包括11种语言(法语、德语、荷兰语、俄语、西班牙语、意大利语、土耳其语、波斯语、瑞典语、蒙古语和中文)的语音、文字转录及英文译文。其中数据集和论文如下:《CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus》github地址:https://github.c...

2020-03-05 13:27:31 1203 1

原创 判断是否为平衡二叉树

题目描述输入一棵二叉树,判断该二叉树是否是平衡二叉树平衡二叉树定义:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。举例:判断二叉树是否为平衡二叉树例1: E / \ A D / \ B C 例2: E / A / \ B C...

2020-02-15 10:51:26 259

原创 Python二叉树和二叉树的镜像

1. 题目描述操作给定的二叉树,将其变换为源二叉树的镜像。2. 输入描述二叉树的镜像定义:源二叉树 8 / \ 6 10 / \ / \ 5 7 9 11 镜像二叉树 8 / \ 10 6 / \ / \ 11 9 7 ...

2020-02-04 17:05:31 627 1

原创 Python二叉树实现和遍历

1. 树的基本概念若一个结点有子树,那么该结点称为子树根的"双亲",子树的根是该结点的"孩子"。有相同双亲的结点互为"兄弟"。一个结点的所有子树上的任何结点都是该结点的后裔。从根结点到某个结点的路径上的所有结点都是该结点的祖先。结点的度:结点拥有的子树的数目。叶子:度为零的结点。分支结点:度不为零的结点。树的度:树中结点的最大的度。层次:根结点的层次为1,其余结点的层次等于该结点的双亲...

2020-02-03 16:22:45 1104 1

原创 matlab保存符合条件的值到一个新的向量

之前用MATLAB做数值计算,没用到过保存符合条件数据的功能,MATLAB已经不常用了。前几天,做一个小实验要保存一下中间程序产生的数据,尝试了半天,没想到简单的方法,后来百度发现了一个小技巧,现记录如下:比如产生1到100的递增向量,现在需要保存向量中大于50的向量,怎么用MATLAB实现?clc,clear;kmax=100;a = [];for k=1:kmax if k...

2019-12-08 16:39:52 6518 1

原创 CondaHTTPError HTTP 000 CONNECTION FAILED for url 解决方法

Ubuntu16.04上,之前好好的miniconda环境,现在想创建一个新环境,竟然报错了???报错内容Collecting package metadata (current_repodata.json): failedCondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://conda.anaconda.org/pyt...

2019-12-04 19:27:31 3654 3

原创 利用阿里云搭建frp内网穿透,实现外网远程桌面连接内网

面临的问题实验室有电脑A,但是在实验室内网环境中,外网无法直接远程桌面访问。现在我不常去实验室,但是还需要用到实验室电脑资源。其他解决办法远程控制电脑的一些软件,像向日葵软件,Teamviewer等,免费的没法长时间用,一是网速慢,容易卡顿;二是网络不顺畅,经常连接不上Teamviewer,据说是实验室已经关闭了Teamviewer的端口,体验很不爽。本文解决办法-内网穿透可以...

2019-11-30 20:27:59 5686 8

原创 RuntimeError: CUDA error: invalid device ordinal (exchangeDevice at /opt/conda/conda-bld/pytorch_154

pytorch出现下面的错误RuntimeError: CUDA error: invalid device ordinal (exchangeDevice at /opt/conda/conda-bld/pytorch_1549628766161/work/aten/src/ATen/cuda/detail/CUDAGuardImpl.h:28)很大可能是你GPU参数设置的不正确。比如你只有...

2019-11-13 20:38:10 1697

原创 interspeech2019论文下载入口

interspeech2019论文下载入口

2019-10-29 16:52:20 2898

原创 PermissionError: [Errno 1] Operation not permitted

如果出现这种提示:PermissionError: [Errno 1] Operation not permitted,很大可能是服务器cpu核数不够多,线程被别人占用,而自己设置的线程数又太大,导致资源不够分配,服务器拒绝。可以把并行的程序数减少。改为nj=5或者更小。...

2019-09-07 09:45:44 13728

原创 字符串编辑距离

编辑距离语音识别领域和NLP领域都会接触到WER(字错率)和CER(字符错误率),但两者的计算都离不开字符串编辑距离。字符串编辑距离(Edit Distance),是俄罗斯科学家Vladimir Levenshtein提出的概念。两个字符串之间的最小距离就是指把一个字符串转换为另一个字符串时,所需要的最小编辑操作的次数。编辑操作包含以下3种:替换(substitution),将一个字符替换为...

2019-08-25 11:00:58 884 1

原创 ubuntu16.04新建用户后找不到cuda

当你在服务器上新建一个用户后,输入nvcc -V提示The program 'nvcc' is currently not installed. You can install it by typing: apt-get install nvidia-cuda-toolkit,通过ls /usr/local/cuda*可知,服务器上已经安装好cuda-8.0和cuda-9.0,怎么解决?在你登录...

2019-07-23 16:24:39 2725

原创 Ubuntu16.04在指定目录下新建用户并指定权限

方法一:使用adduser命令在默认路径/home下新建用户切换为管理员用户获取创建用户的权限添加一个新用户,以用户名abc为例:adduser abc然后根据系统提示填写密码即可,其他可以不用填写然后退出当前用户,以用户abc登录系统,可以看到abc所在的目录默认是/home/abc方法二:使用useradd命令,可以自定义设置家目录选项: -b, --base-di...

2019-07-19 22:37:33 4421 1

原创 bash env command not found

解决办法:出现这个错误是因为一些文件路径有问题,检查当前用户的.bashrc文件,确保文件中的路径一定是这种格式export PATH="/disk3/qszhu/bin:$PATH",前后两个PATH都不能少,不然会报错。...

2019-07-07 20:30:47 3143

原创 [python单链表]单链表的基础实现

单链表的Python实现# 结点类class Node: def __init__(self, value): self.value = value self.next = None# 单链表class SingleLinklist: def __init__(self, node=None): # 头结点定义为私有变量...

2019-06-28 11:27:28 334

原创 [python队列]用链表实现队列

队列是一种先进先出的线性表我们定义如下的链表来实现队列数据结构:定义一个头结点,左边指向队列的开头,右边指向队列的末尾,这样就可以保证我们插入一个元素和取出一个元素都是O(1)的操作。方法一,用链表实现程序如下:# 定义一个头结点,左边指向队列的开头,# 右边指向队列的末尾,保证我们插入一个元素和取出一个元素都是O(1)的操作class Head: def __init__...

2019-06-28 10:40:02 2192

原创 [python栈]栈基础实现

栈是一种只能通过访问一端来实现数据存储与检索的线性数据结构,具有后进先出的特征。栈的抽象数据类型一个栈一般会实现以下方法:Stack() 构造方法,创建一个空栈,无参数,返回值是空栈push(value) 向栈顶压入一个新数据项,需要一个数据项参数,无返回值pop() 抛出栈顶数据项,无参数,返回被抛出的数据项,栈本身发生变化is_empty() 测试栈是否空栈。不需要...

2019-06-26 10:33:09 413

原创 [python字符串]替换空格

题目描述:请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。思路:先把字符串转成list,然后对list遍历,如果s[i]=’ ‘则插入’%20’# -*- coding:utf-8 -*-class Solution: # s 源字符串 def replaceS...

2019-06-24 20:46:40 1501

原创 [python链表]输入两个链表,找出它们的第一个公共结点。

题目:输入两个链表,找出它们的第一个公共结点。思路:用python解决的话,相对比较简单,把链表1中的值依次放到list1,然后依次遍历链表2,如果遍历到的值在list1中,说明找到了第一个公共结点,return即可。当然边界情况需要考虑。python代码如下:# -*- coding:utf-8 -*-# class ListNode:# def __init__(self, ...

2019-06-24 19:42:25 702 2

原创 腾讯云ubuntu16.04搭建ftp文件传输服务器

安装VSFTPD使用apt-get安装vsftpd:sudo apt-get install vsftpd -y启动VSFTPD安装完成后VSFTPD会自动启动,通过netstat命令可以看到系统已经监听了21端口:sudo netstat -nltp | grep 21如果没有启动,可以手动开启VSFTPD服务:sudo systemctl start vsftpd.servic...

2019-06-18 21:28:32 636

原创 undefined symbol: _ZN3c1019UndefinedTensorImpl10_singletonE

ImportError: /usr/local/lib/python3.5/dist-packages/torchvision/_C.cpython-35m-x86_64-linux-gnu.so: undefined symbol: _ZN3c1019UndefinedTensorImpl10_singletonE

2019-06-16 17:43:20 9222 1

原创 ubuntu16.04上传本地代码到GitHub

首先确定ubuntu16.04已经安装好git,如果没有安装,输入sudo apt-get install git安装完git后,生成SSH key,[email protected]是你GitHub绑定的邮箱。ssh-keygen -t rsa -C "[email protected]"按照提示,下一步下一步即可,生成完SSH key之后,需要打开秘钥粘贴到Gi...

2019-06-07 21:15:03 292

原创 ubuntu16.04安装指定版本g++,gcc

查看ubuntu系统上g++的版本:ls /usr/bin/g++*安装新版gcc和g++sudo apt-get install gcc-4.9 g++-4.9切换不同版本当ubuntu系统上安装了不同版本的gcc和g++,可以使用update-alternatives命令设置默认使用哪个版本,典型的如在Ubuntu 16.04里安装了gcc-4.8和gcc-6, 想让g...

2019-05-29 14:17:04 9115 1

原创 UnicodeEncodeError: 'ascii' codec can't encode character '\u5728' in position 6: ordinal not in rang

今天运行python3.5程序,提示如下错误:UnicodeEncodeError: 'ascii' codec can't encode character '\u5728' in position 6: ordinal not in range(128)肯定是编码格式的问题,百度了一圈,终于发现了一个能用的方法,现记录如下:在Python3程序开头加上如下代码:import codec...

2019-04-30 23:43:49 1281

原创 TypeError: the JSON object must be str, not 'bytes'

Python3.5加载json文件,这一行代码总是提示错误,搜索了很多,尝试了更改f.encode('utf-8'),照样报错,仍然没解决问题。相关问题可以查看以下链接:有问题的代码:# read json data with open(args.recog_json, 'rb') as f: js = json.load(f)['utts']最终改为这样解决问题:...

2019-04-30 23:30:59 4350

原创 Could not install packages due to an EnvironmentError: [Errno 13] 权限不够

Ubuntu下安装库时,比如pip install tqdm提示Could not install packages due to an EnvironmentError: [Errno 13] 权限不够: '/usr/local/lib/python3.5/dist-packages/tqdm' Consider using the --user option or check the per...

2019-04-28 09:07:17 432

转载 语音识别相关会议期刊、资料、主页博客

目录一.会议1.1国际最顶尖会议1.2其他二. 期刊2.1国内2.2国外:三.国际语音识别技术研究机构四.国际语音识别技术评测五. 语音识别技术工具包六.主页和博客转载自https://blog.csdn.net/tbl1234567/article/details/7...

2019-04-19 16:30:39 1413 2

原创 tensorflow高层API之Estimator

Estimators是TensorFlow的高层API,它大大简化了机器学习的编程。通过Estimator创建一个模型,我们不用再写一些很底层的代码(比如定义变量、定义网络层等),可以像scikit-learn和Keras那样,用几行代码轻松创建一个模型。Estimator封装了以下功能:模型训练;模型评价;模型预测;模型导出。Estimator模型由三部分构成:Input func...

2019-04-17 21:54:36 505

原创 MNIST数据集转换成TFRecord文件

TFRecord 文件中的数据都是通过 tf.train.Example Protocol Buffer 的格式存储的。以下为 tf.train.Example 的数据结构:message Example { Features features = 1;};message Features{ map<string, Feature> feature = 1;};messa...

2019-04-02 16:34:21 1010 1

DSPII计算机作业2.pdf

答案和代码,Consider an AR process x(n) defined by the difference equation 关注微信公众号:语音技术杂货铺,回复:DSP 免费下载

2019-12-04

如何撰写和发表SCI期刊论文【美】金坤林著

如何撰写和发表SCI期刊论文【美】金坤林著,此书为高清PDF版

2018-10-25

QPSK通信系统的蒙特卡洛(Monte-Carlo)仿真

QPSK的蒙特卡洛仿真,此为MATLAB仿真程序实验报告,里面附带有源程序。

2018-10-25

WinRAR免广告版

WinRAR免广告版本,这是我一直在用的软件,非常良心,不会再因为每次解压文件弹广告而心烦。

2018-10-25

王世一数字信号处理

本电子书是数字信号处理,由王世一老先生编写,中国科学技术大学考研参考教材,此为PDF高清版,欢迎大家下载。

2018-10-23

Java写的计算器

Java写的计算器,很好玩,Java写的计算器,很好玩,下载试玩

2018-01-04

图书馆管理系统

C#语言写的图书馆管理系统,C#语言写的图书馆管理系统

2018-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除