- 博客(54)
- 资源 (1)
- 收藏
- 关注
转载 【转】WebRTC AECM时延估计
时延问题:一般基于互相关计算的自适应时延估计算法的计算复杂度为,其随计算范围的增长呈二次上升趋势,因此很难再如此大的范围内进行动态地时延计算。在实际应用中一般采用大范围粗略估计加小范围精确计算的方法,例如在WebRTC的AECM回声消除模块中,其API接口中有一个特殊的参数msInSoundCardBuf,要求调用者传入一个以毫秒为单位的回声时延估计值,然后又AECM内部在这个估计值的基础上进行**小范围内回声时延精确计算,因此该参数的准确性将直接音响到AECM内部时延计算准确性和速度,而这种影响又能直观的
2021-09-01 14:05:39 1288
转载 ssh: connect to host github.com port 22: Connection timed out
昨天在使用VsCode向GitHub上传代码时,出现错误:(此前已经使用SSH的方式连接了GitHub仓库)ssh: connect to host github.com port 22: Connection timed outPlease make sure you have the correct access rightsand the repository exists.首先输入以下命令检查SSH是否能够连接成功(ssh后面有空格)ssh -T git@github.com发现报错
2021-08-27 10:41:08 2575
转载 WebRTC_AEC
深入浅出 WebRTC AEC(声学回声消除)转载。原址:https://blog.51cto.com/u_14968479/2562432阿里云视频云2020-12-10 16:45:44©著作权文章标签webrtc音频AEC回声消除阅读数2253前言:近年来,音视频会议产品提升着工作协同的效率,在线教育产品突破着传统教育形式的种种限制,娱乐互动直播产品丰富着生活社交的多样性,背后都离不开音视频通信技术的优化与创新,其中音频信息内容传递的流畅性、完整性、可懂度直接决定着用户之间的沟通质量。自 20
2021-08-02 10:11:31 1264 2
转载 wetrtc_agc
详解 WebRTC 高音质低延时的背后 — AGC(自动增益控制)作者|珞神审校|泰一前言自动增益控制(AGC:Auto Gain Control)是我认为链路最长,最影响音质和主观听感的音频算法模块,一方面是 AGC 必须作用于发送端来应对移动端与 PC 端多样的采集设备,另一方面 AGC 也常被作为压限器作用于接收端,均衡混音信号防止爆音。设备的多样性最直接的体现就是音频采集的差异,一般表现为音量过大导致爆音,采集音量过小对端听起来很吃力。在音视频通话的现实场景中,不同的参会人说话音量各有不同
2021-07-27 09:36:51 322
原创 linux中flac安装
在跑mini_librispeech的时候,下载好数据会提示Please install ‘flac’ on ALL worker nodes!这是因为数据集是flac的压缩格式,而Linux系统没有安装解码的软件,所以我们需要安装flac。第一步 下载wget https://downloads.xiph.org/releases/flac/flac-1.3.3.tar.xzwget http://www.linuxfromscratch.org/patches/blfs/svn/flac-1.
2021-04-30 15:28:10 1653 1
原创 shel--dot: not found相关问题
用dot在处理一个图片时报如下错误:sh: dot: not found如下解决:sudo apt-get install graphviz运行下列脚本,即可画出fst图。dot问题解决。fstdraw --isymbols=isymbols --osymbols=osymbols out.fst | dot -Tjpg >out.jpg...
2021-04-29 14:30:24 343
原创 kaldi中libcudart.so.10.0: cannot open shared object file: No such file or directory
重新编译kaldi,解决。
2021-01-07 15:13:43 223
转载 Python os.system引用变量写法
在命令中引用%s ,第一个代表%s,代表后面括号内第一个;第二个代表%s,代表后面括号内第二个,以此类推 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019-06-18 # @Author : moba # @Site : import os dir = '/root' dir2 = '/tmp' os.system("ls %s...
2020-12-02 11:38:58 1924
转载 matlab将文件编码设置为UTF-8的方法
问题描述计算机中的文本往往有多种编码格式:ANSI UTF-8(有/无 BOM)一般而言,UTF-8码对中文支持较好,latex、pandoc的文本转换都需要utf-8码,但是MATLAB默认编码形式为ANSI。问题:如何设置MATLAB,使之输出的文本编码为UTF-8码。解决方案在打开文件,准进行写入操作时,指定编码形式。fid = fopen(filename,'w','n','UTF-8');应用示例strTitle0 = '# 拉弯构件计算报告..
2020-10-20 17:15:52 12235
原创 Python语音信号处理的一些kit
librosa使用与安装https://blog.csdn.net/zzc15806/article/details/79603994https://www.cnblogs.com/LXP-Never/p/11561355.htmhttps://www.cnblogs.com/xingshansi/p/6816308.htmllibrosa的文件https://github.com/librosa/librosa/releases/https://github.com/librosa
2020-10-08 16:27:22 322
原创 swig安装
https://www.cnblogs.com/no-tears-girl/p/10456738.htmlhttps://www.cnblogs.com/no-tears-girl/p/10456738.html下载网址http://www.linuxfromscratch.org/blfs/view/cvs/general/swig.html
2020-09-28 13:54:59 283 1
原创 [参考]将geany回车后默认的制表符改为空格
https://blog.csdn.net/vs974532452/article/details/84991382
2020-09-27 12:36:53 184
原创 [参考]Markdown中如何添加特殊符号
Markdown中如何添加特殊符号https://blog.csdn.net/weixin_44489823/article/details/104711091
2020-09-27 12:35:12 632
转载 几款主流好用的markdown编辑器介绍
https://blog.csdn.net/davidhzq/article/details/100815332
2020-09-23 14:42:28 112
原创 如何修改txt文本文件的默认编码为UTF-8
https://zhidao.baidu.com/question/560895811224581924.html
2020-09-23 10:33:06 4615
原创 Python工具包phkit遇到的问题
问题描述发现文件夹中文件是正常存在的解决办法:将with open(inpath, ..) ..... 中的inpath改成str(inpath),遍历所有的上述问题,解决。具体原因:pathlib integrates seemlessly with open only in Python 3.6 and later. From Python 3.6's release notes:The built-in open() function has bee...
2020-09-23 10:31:04 467
原创 [参考]kaldi学习笔记 -- 构造语言模型相关脚本 -- ami_train_lms.sh,utils/format_lm.sh
https://blog.csdn.net/DuishengChen/article/details/52514477
2020-09-17 16:45:55 129
原创 irstlm手动安装
首先 手动下载irstlm.zip,并复制到tools目录中,利用命令解压到irstlm/https://github.com/irstlm-team/irstlm.git 然后 按照下面步骤安装:HOW TO INSTALL WITH AUTOMAKEStep 0:$> sh regenerate-makefiles.sh [--force]Set parameter force to the value "--force" if you want to re...
2020-09-16 15:58:24 722
转载 2020-09-09语音识别系列之区分性训练和LF-MMI
在传统的语音识别中,区分性训练扮演着非常重要的角色,是语音识别学习中的一个重点和难点。如今,端到端的语音识别系统虽初露锋芒,是目前语音识别研究的热点,但在实际工业应用中,传统的语音识别仍然占据着主导地位,区分性训练仍然发挥着重要角色。并且,区分性训练更重要的是其基本思想,相信其思想和基本方法未来也会在端到端的语音识别系统中有广泛应用。所以,值得一写,值得一看,值得一学。本文介绍区分性训练、其改进版本LF-MMI(Lattice Free Maximum Mutual Information)和Kaldi
2020-09-09 17:34:12 1011
转载 语音识别——kaldi - Online Audio Server(服务器客户端建立方法-旧版在线解码)
文章目录 一、服务器客户端识别系统建立方法 1. Command line to start the **server**(服务器端启动方式): 1.1 Arguments are as follow(参数意义): 2. Command line to start the **client**(客户端启动方式): 2.1 Arguments are as follow(参数意义): * Command line to start the Java cli
2020-09-02 16:52:53 832
转载 吴恩达机器学习(九)Precision、Recall、F-score、TPR、FPR、TNR、FNR、AUC、Accuracy
针对二分类的结果,对模型进行评估,通常有以下几种方法:Precision、Recall、F-score(F1-measure) TPR、FPR、TNR、FNR、AUC Accuracy初始作如下定义: 真实结果 1 0 预测结果 1 TP(真阳性) FP(假阳性) 0 FN(假阴性) TN(真阴性) TP(True Positive):预测结果为正类,实际上就是正类 FP(False Positive):预测结果为正类,实..
2020-09-02 15:16:05 1166
原创 snips示例tdnn训练报错
ERROR (nnet3-chain-train[5.5.0-]:AllocateNewRegion():cu-allocator.cc:519) Failed to allocate a memory region of 2502950912 bytes. Possibly this is due to sharing the GPU. Try switching the GPUs to exclusive mode (nvidia-smi -c 3) and using the opti...
2020-09-01 11:40:14 396 1
原创 cat <<EOF语句的意思
一,关于cat << EOF语句的意思在linux shell脚本中cat << EOF的语句,起到什么作用?首先必须要说明的是EOF在这里没有特殊的含义,你可以使用FOE或OOO等(当然也不限制在三个字符或大写字符)。接下来,简单描述一下几种常见的使用方式及其作用:1、cat<<EOF,以EOF输入字符为标准输入结束:2、cat>filename,创建文件,并把标准输入输出到filename文件中,以ctrl+d作为输入结束:3、cat&g
2020-08-31 15:52:19 1729
原创 JSON文本格式解读
JSON(JavaScript Object Notation) 是一种轻量级的bai数据交换格式。 易于人阅读du和编写。同时也易于机器解析zhi和生dao成。 它基于JavaScript Programming Language,Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。..
2020-08-31 15:22:37 862
转载 Linux三剑客之awk命令
awk简介awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言: AWK 程序设计语言 , 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。awk是一种很棒的语言,它适合文本处理和报表生成,其语法较为常见,借鉴了某些语言的一些精华,如C语言等。在linux...
2020-08-31 15:07:26 159
转载 为什么 Linux 的 htop 命令完胜 top 命令
在 Linux 系统中,top 命令用来显示系统中正在运行的进程的实时状态,它显示了一些非常有用的信息,比如 CPU 利用情况、内存消耗情况,以及每个进程情况等。但是,你知道吗?还有另外一个命令行工具 'htop',它与传统的 top 命令功能一样,但它有更加强大的功能及能显示更多的信息。这篇文章,我们会用实例来讨论这个 'htop' 命令。Linux 中的 htop 命令下面是从 htop 的手册页摘抄下来的相关描述:它类似于 top 命令,但可以让你在垂直和水平方向上滚动,所以你可以看到系
2020-08-29 11:26:50 141
原创 kaldi中aishell运行时出现的GPU问题及解决办法
问题 1:This script is intended to be used with GPUs but you have not compiled Kaldi with CUDAIf you want to use GPUs (and have them), go to src/, and configure and make on a machinewhere "nvcc" is installed.解决办法:cd 到src目录下,检查src/configure文件中cuda安装路径是
2020-08-19 14:08:55 1111 1
转载 kaldi安装过程
1.下载kaldi的文件git clone https://github.com/kaldi-asr/kaldi.git12.进入toolscd toolscat INSTALL1 2按照指令一步步进行extras/check_dependencies.sh#检查依赖性,没有的包按照指令安装make or make -j 4(多线程加快进度)1 2 3 4 53.进入srccd srccat INSTALL1 2按照指令安装
2020-08-18 10:08:49 298
转载 kaldi入门详解——aishell步骤解释
kaildi讲解kaldi是一个开源的语音识别工具箱,是基于c++、perl、shell编写的,可以在windows和unix 平台上编译。教程网页:http://www.kaldi-asr.org/doc/ 里面可以查阅语音/说话人识别实现过程、kaldi的数据结构、命令的使用说明等。还有网上的dan的ppt。kaldi下载:https://github.com/kaldi-asr/kaldi。语音识别基础知识快速入门英文:《Speech and Language Processing
2020-08-18 10:06:44 3779 3
Microphone Array Signal Processing by Jacob Benesty.rar
2020-06-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人