独钓寒江雪

私信 关注
tiankong_hut
码龄5年

博客主页: https://blog.csdn.net/qq_34638161 Github地址: https://github.com/tiankong-hut

  • 727,435
    被访问量
  • 56
    原创文章
  • 12,709
    作者排名
  • 98
    粉丝数量
  • 于 2016-04-12 加入CSDN
获得成就
  • 获得151次点赞
  • 内容获得105次评论
  • 获得633次收藏
荣誉勋章
兴趣领域
  • #人工智能
    #语音识别
TA的专栏
  • 麦克风阵列
    4篇
  • C/C++
    5篇
  • 阵列麦克风
    2篇
  • 机器学习
    23篇
  • 语音分离
    7篇
  • Python学习
    116篇
  • 自然语言处理-NLP
    3篇
  • 科研人生
    19篇
  • Ubuntu学习
    38篇
  • 网络协议
    1篇
  • 语音识别
    2篇
  • 语音增强
    5篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

amixer命令

简述amixer及其用法:alsamixer是Linux 音频架构ALSA中的Alsa工具的其中一个,用于配置音频的各个参数。alsamixer是基于文本下的图形界面的,可以通过键盘的上下键,左右键等,很方便地设置需要的音量,开关某个switch(开关)等等操作。amixer,是alsamixer的文本模式,即命令行模式,需要用amixer命令的形式去配置你的声卡的各个选项。1.先看看amixer支持哪些命令,大概有哪些功能amixer --help2.再看看当前的音频系统提供了哪些接口
转载
29阅读
0评论
0点赞
发布博客于 2 月前

TX2更改系统时间

啊
原创
46阅读
0评论
0点赞
发布博客于 2 月前

QT中的工程 Pro文件

QT工程pro文件模板变量(TEMPLATE)模板变量告诉qmake为这个应用程序生成哪种makefile。下面是可供使用的选择:app - 建立一个应用程序的makefile。这是默认值,所以如果模板没有被指定,这个将被使用。 lib - 建立一个库的makefile。 vcapp - 建立一个应用程序的Visual Studio项目文件。 vclib - 建立一个库的Visual Studio项目文件。 subdirs - 这是一个特殊的模板,它可以创建一个能够进入特定目录并且为一个项目
转载
33阅读
0评论
0点赞
发布博客于 2 月前

XMOS 开发

开发板型号:XUF216-512-TQ128-C20
原创
57阅读
0评论
0点赞
发布博客于 3 月前

win10安装XMOS xTIMEcomposer 软件

XMOS官网下载xTIMEcomposer 14.4.1https://www.xmos.ai/software-tools/下载后安装步骤安装即可,运行xTIME Composer Studio (Community_14.4.1) ,出现错误:必须采用 32位的 JRE ,之前一直卡在这里,没注意这句话下载 32位绿色 jdk ,免安装,不用配置环境在开头添加下面一句:-vmC:\Users\sky\Desktop\JDK8_32\bin\javaw.e..
原创
70阅读
0评论
0点赞
发布博客于 3 月前

linux环境用usb麦克风阵列ALSA音频设备录音

编译:gcc read_microphone.c -o read_microphone -lasound生成read_microphone可执行文件,运行:./read_microphone//https://blog.csdn.net/maowendi/article/details/82348690// gcc read_microphone.c -o read_microphone -lasound/*read from the default PCM device ...
转载
357阅读
0评论
0点赞
发布博客于 7 月前

Qt项目编译正常,但运行找不到动态库

QT开发——动态库/静态库的生成与调用export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/sky/lib
转载
569阅读
0评论
0点赞
发布博客于 8 月前

语音识别的降噪思路和总结--重要

参考:https://www.cnblogs.com/welen/p/10524077.html作者:对语音、音频信号处理非常感兴趣。主要涉及:语音和音频处理;音效;去噪和回声消除;机器学习和算法优化。 噪声问题一直是语音识别的一个老大难的问题,在理想的实验室的环境下,识别效果已经非常好了,之前听很多音频算法工程师抱怨,在给识别做降噪时,经常发现WER不降反升,降低了识别率,有点莫名其妙,又无处下手。  刚好,前段时间调到了AIlab部门,有机会接触这块,改善语音识别的噪声问题,虽.
转载
584阅读
0评论
0点赞
发布博客于 8 月前

ADB调试(win10)

ADB软件下载、安装、设置:https://www.cnblogs.com/tangbohu2008/p/9475092.html (参考)http://adbshell.com/upload/adb.zip (ADB下载)http://adbshell.com/ (下载)http://dl.adbdriver.com/upload/adbdriver.zip (安装usb驱动下载)https://blog.csdn.net/yuewen2008/article/details...
转载
224阅读
0评论
1点赞
发布博客于 9 月前

Linux音频软件:Alsa、OSS和Pulseaudio、ESD、

Linux 音频系统简析https://blog.csdn.net/meizum10/article/details/17437959PulseAudio,ESD和ALSA,OSS的关系https://forum.ubuntu.org.cn/viewtopic.php?t=163776关于pulseaudio和alsa(贴吧)https://tieba.baidu.com/p/3790145023?red_tag=3544148596PulseAudio简介http://blog
转载
386阅读
0评论
0点赞
发布博客于 9 月前

C/C++ 链接库

1、动态库生成gcc -fPIC -shared cat.c -o libcat.so-fPIC是压制警告-shared是生成动态库cat.c是要编译的文件-o是要生成的文件的名称2、编译指令直接链接调用gcc main.c -L. -lcat -o test-L. 表示链接的动态库在本地文件夹执行可执行文件时,需要添加本地目录到lib目录,否则会报“canno...
转载
89阅读
0评论
0点赞
发布博客于 10 月前

Ubuntu 头文件和库文件添加环境变量

对所有用户有效在/etc/profile增加以下内容。只对当前用户有效在Home目录下的.bashrc或.bash_profile里增加下面的内容:(注意:等号前面不要加空格,否则可能出现 command not found)#在PATH中找到可执行文件程序的路径。export PATH =$PATH:$HOME/bin#gcc找到头文件的路径C_INCLUDE_PATH=/usr/i...
转载
984阅读
0评论
1点赞
发布博客于 10 月前

cmake 下载和安装

参考博客: https://blog.csdn.net/qq_42393859/article/details/85251356
原创
1852阅读
0评论
1点赞
发布博客于 10 月前

麦克风阵列技术

麦克风阵列总体介绍:https://blog.csdn.net/sxau_zhangtao/article/details/100118205https://blog.csdn.net/sxau_zhangtao/article/details/100118865https://blog.csdn.net/isuccess88/article/details/78446585麦克风...
转载
159阅读
0评论
0点赞
发布博客于 1 年前

回声消除-AEC

开源的轮子是speex以及webrtc:WebRTC,名称源自网页即时通信(英语:Web Real-Time Communication)的缩写,是一个支持网页浏览器进行实时语音对话或视频对话的API。它于2011年6月1日开源并在Google、Mozilla、Opera支持下被纳入万维网联盟的W3C推荐标准。在webRTC开源前主要是大公司和专业的算法公司有好的实现方案,一般公司要想产品...
转载
667阅读
0评论
0点赞
发布博客于 1 年前

麦克风阵列声源定位解决方案

其高科技:http://www.keygotech.com/cn/solution/ssl/array/noise-source-location-based-on-mic-array一般来说,基于麦克风阵列的声源定位算法划分为三类:一是基于波束形成的方法;二是基于高分辨率谱估计的方法;三是基于声达时延差(TDOA)的方法。语音定位跟踪系统基于可控波束成形技术,相比于基于...
转载
3076阅读
4评论
0点赞
发布博客于 1 年前

g++ gcc 安装及降级

https://www.cnblogs.com/lqruui/p/6062443.html查看gcc版本和g++版本cd /usr/binls -l gcc*ls -l g++*安装gcc和g++ 4.4版本sudo apt-get install gcc-4.4 g++-4.4 g++-4.4-multilib修改g++链接sudo m...
转载
253阅读
0评论
0点赞
发布博客于 1 年前

Transformer 介绍

Transformer论文:https://arxiv.org/abs/1706.03762代码解析:https://blog.csdn.net/mijiaoxiaosan/article/details/74909076https://baijiahao.baidu.com/s?id=1622064575970777188&wfr=spider&for=pcht...
转载
117阅读
0评论
0点赞
发布博客于 1 年前

阵列信号处理知识点汇总

推荐书籍:《阵列信号处理及MAATLAB实现》张小飞 电子工业出版社 2015年《空间谱估计理论与算法》王永良 陈辉 彭应宁 万群 清华大学出版社 2004年《自适应阵列处理》王永良 李荣锋 丁前军 清华大学出版社 2009年《MATLAB在语音信号分析与合成中的应用》宋知用 北京航空航天大学出版社 2013年《麦克风阵列信号处理》Jacob Benesty(加拿大...
转载
655阅读
0评论
3点赞
发布博客于 2 年前

荣耀 MagicBook Pro 加装固态硬盘

电脑于2019年10月1日在华为天猫官方商城抢购,6099机器配置:咨询华为商城的客服,得到的回复:荣耀 MagicBook Pro 最大可以扩展 HDD 2TB,可以更换 SSD 1TB。支持 2.5 英寸、SATA3.0 接口的 HDD 硬盘;支持 NVMe 协议、M.2 2280 接口的 SSD 硬盘。具体兼容的硬盘品牌和规格请参考“荣耀MagicBook Pr...
原创
10097阅读
4评论
0点赞
发布博客于 2 年前

安装 torchvision

conda install torchvision -c pytorch使用 pip install torchvision 会保错https://blog.csdn.net/chengyq116/article/details/83792983
转载
481阅读
0评论
0点赞
发布博客于 2 年前

安装 opencv 模块

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python参考博客: https://blog.csdn.net/weixin_42606065/article/details/88176718
转载
79阅读
0评论
0点赞
发布博客于 2 年前

docker 安装和使用

在windows 10 家庭版中安装 dockerwin10家庭版安装Docker for Windows:https://www.cnblogs.com/samwu/p/10360943.htmlhttps://blog.csdn.net/zzq060143/article/details/91050272docker镜像加速:https://www.cnblogs.com/...
转载
56阅读
0评论
0点赞
发布博客于 2 年前

按信噪比 SNR 混合纯净语音和噪声

可以选择 cut 或者 append 模式SNR_a1.py:import scipy.io.wavfile as wavimport numpy as npimport scipy# x1--合并的纯净语音, x2--单个噪声 ,所以 x1 >> x2def signal_by_db(x1, x2, snr, handle_method): from n...
转载
933阅读
1评论
0点赞
发布博客于 2 年前

librosa 安装

参考博客: https://blog.csdn.net/zzc15806/article/details/79603994https://pypi.org/project/librosa/librosa 安装时总是不成功,网络不好超时。conda install -c conda-forge librosa 或者:pip install librosa通过源码安装,下载地址:...
原创
1109阅读
6评论
0点赞
发布博客于 2 年前

python 合并语音(混合、拼接、连接、merge)

单层文件夹下的多句语音合并为一个语音:#merge_files_in_a_folder # 合并音频def merge_files(path_read_folder, path_write_wav_file): # files = os.listdir(path_read_folder) merged_signal = [] for filename in ...
原创
2539阅读
0评论
1点赞
发布博客于 2 年前

keras 保存和加载模型

https://www.cnblogs.com/weiyinfu/p/9788179.htmlhttps://blog.csdn.net/rubysxl/article/details/86510253 :模型权重很容易使用HDF5格式存储,而网络结构可以以JSON或YAML格式保存。https://yq.aliyun.com/articles/599528 :Keras使用保存...
转载
439阅读
0评论
0点赞
发布博客于 2 年前

python 画语音波形图和语谱图

https://github.com/eesungkim/Speech_Enhancement_DNN_NMF # 将numpy array 有int转换为float clean_test = clean_test.astype(float) #将numpy array从int转换为float,纯净语音 noisy_test = noisy_test.astyp...
原创
4005阅读
1评论
1点赞
发布博客于 2 年前

tf.device() 查看和指定 GPU或CPU 设备

GPU_device.py:# https://blog.csdn.net/lemon_tree1994/article/details/79206790# https://blog.csdn.net/dcrmg/article/details/79747882import tensorflow as tfimport osos.environ["CUDA_VISIBLE_DEVIC...
转载
1158阅读
0评论
0点赞
发布博客于 2 年前

不同信噪比SNR语音混合,以及波形图

代码含有:wav音频读取、语音混合、语谱图# coding = utf-8import numpy as npfrom matplotlib import pyplot as pltimport librosaimport scipydef SNR(x1, x2): from numpy.linalg import norm return 20 * np.log1...
原创
579阅读
0评论
0点赞
发布博客于 2 年前

将numpy array由 int 转换为 float

https://blog.csdn.net/elecjack/article/details/50920318
转载
7835阅读
0评论
1点赞
发布博客于 2 年前

语音信号基础--信噪比(SNR)

我的博客: https://blog.csdn.net/qq_34638161/article/details/89711441 信噪比就是信号的平均功率和噪声的平均功率之比:S/N。用分贝(dB)作为度量单位:信噪比 = 10 * log10(S/N) (dB)信噪比(SNR):20lg10(norm(x1)/norm(x2))norm:求向量或范数。def SNR(x1,...
原创
5030阅读
0评论
0点赞
发布博客于 2 年前

tensorflow和keras对应的版本

对应的网址:https://docs.floydhub.com/guides/environments/AttributeError: module 'tensorflow.python.keras.backend' has no attribute 'get_graph'原因:tensorflow版本和keras版本不匹配...
转载
5227阅读
0评论
1点赞
发布博客于 2 年前

python导入自定义模块

https://www.cnblogs.com/telazy/p/8967515.html导入子目录文件:需要引入子目录下的文件,则可以采用import一个包的形式,将子目录封装成包,即可调用。在子文件夹下建立 __init__.py 文件:或者:import syssys.path.append("F:\Study\Speech")导入同级目录文件:...
转载
187阅读
0评论
0点赞
发布博客于 2 年前

下载任意版本vmware对应的vmware tools

参考博客:https://baijiahao.baidu.com/s?id=1636060669707508136&wfr=spider&for=pc网址:http://softwareupdate.vmware.com/cds/vmw-desktop/ws/(如下图)查看虚拟机版本:15.5.0进入:选择windows选择packages...
转载
33114阅读
3评论
6点赞
发布博客于 2 年前

禁止win10更新

win10版本:1903操作系统版本:18362.418今天刚更新系统http://www.xitongtiandi.net/wenzhang/soft/26385.htmlhttps://blog.csdn.net/qq_15020543/article/details/81740237https://jingyan.baidu.com/article/0bc808fc1...
转载
121阅读
0评论
0点赞
发布博客于 2 年前

Qt 软件下载、安装

Qt学习: http://c.biancheng.net/view/3851.html官方地址: http://download.qt.io/archive/qt/简书:Q5安装https://www.jianshu.com/p/37c7f227a01bubuntu 下安装Qt:https://blog.csdn.net/m0_37688984/article/de...
转载
144阅读
0评论
0点赞
发布博客于 2 年前

windows10 无法升级

用cmd进入中断,然后在终端里面输入:winver更新出错:win10 更新遇到错误 0x80240fff :https://answers.microsoft.com/zh-hans/windows/forum/windows_10-update-winpc/win10/a7615801-54f6-4113-89b8-37fa941205db用 windows defen...
原创
720阅读
0评论
0点赞
发布博客于 2 年前

爬虫--Get 和 Post 方式爬取数据

以中国旅游网首页(http://www.cntour.cn/)为例,抓取中国旅游网首页首条信息(标题和链接)源码页面:使用 GET 方式抓取数据:使用 Beautiful Soup 解析网页:清洗和组织数据:(未得到下图的效果)相关代码:# http://c.biancheng.net/view/2011.html#cod...
转载
599阅读
0评论
0点赞
发布博客于 2 年前

爬虫--获取机器之心 SOTA模型的数据

参考博客:http://c.biancheng.net/view/2011.htmlSOTA模型:https://www.jiqizhixin.com/sotapython将 str 转换成 json 的方法:https://blog.csdn.net/Pythoncxy/article/details/95203732进入自然语言模块,然后又返回前一层,观察变化情况,多出来...
原创
343阅读
0评论
0点赞
发布博客于 2 年前

Visual Studio 2013 中安装“theme Editor 失败 (win10)

https://marketplace.visualstudio.com/items?itemName=MatthewJohnsonMSFT.VisualStudio2013ColorThemeEditor (官方)https://download.csdn.net/download/wenshui147258/10372076 (下载速度快)参考博客:https://blog.csdn...
转载
117阅读
0评论
0点赞
发布博客于 2 年前

win7下安装TensorFlow0.12.0

安装gpu版pip install --upgradehttps://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-0.12.0-cp35-cp35m-win_amd64.whl安装CPU版本pip install --upgradehttps://storage.googleapis.com/tensor...
转载
358阅读
0评论
0点赞
发布博客于 2 年前

bazel-0.15.1-installer-linux-x86_64.sh 压缩包

bazel-0.15.1,可从官方网址下载:https://github.com/bazelbuild/bazel/releases/tag/0.15.1 网速不佳时可能下载不下来,分享资源为了方便有需要的小伙伴们。
rar
发布资源于 2 年前

bazel-0.15.0-installer-linux-x86_64.sh 压缩包

bazel-0.15.0,可从官方网址下载:https://github.com/bazelbuild/bazel/releases/tag/0.15.0 网速不佳时可能下载不下来,分享资源为了方便有需要的小伙伴们。
rar
发布资源于 2 年前

bazel-0.19.2-installer-linux-x86_64.sh

bazel-0.19.2,可从官方网址下载:https://github.com/bazelbuild/bazel/releases/tag/0.19.2 网速不佳时可能下载不下来,分享资源为了方便有需要的小伙伴们。
sh
发布资源于 2 年前

如何安装Labimg

参考网页:Windows下深度学习标注工具LabelImg安装和使用指南https://www.baidu.com/link?url=IDfoYeIgBZ8AuMh8MBoG_X06KVxpaPQaKKf1JHU6pQlVek6-uYi-KtlLeiA0uVJubCNQGAN8I5vvaPW6CTLvxK&wd=&eqid=e250d1680001b1f2000000065d7...
转载
292阅读
0评论
0点赞
发布博客于 2 年前

Kaldi 语音识别工具

https://www.baidu.com/link?url=LCpGP62v_DEiuzWez31K_OfWWwagZbMIqYsFbR2fcic3wOFH_lzCMobSMIKmbl_k&wd=&eqid=dee9b8990001c9a8000000065d56228d下载https://www.kali.org/downloads/从零开始学kaldi -...
转载
97阅读
0评论
0点赞
发布博客于 1 年前

anaconda在windows7中添加环境变量

添加环境变量的完整路径:F:\Program\Anaconda3\F:\Program\Anaconda3\ScriptsF:\Program\Anaconda3\Library\binF:\Program\Anaconda3\Library\mingw-w64\bin (可选)环境变量添加方式:转载地址:https://www.baidu.com/link?...
转载
2424阅读
0评论
1点赞
发布博客于 2 年前

安装 Pycharm5.0 并激活

官网 Pycharm Version5.0下载:https://www.jetbrains.com/pycharm/download/previous.htmlPycharm安装-Version 5.0:https://www.baidu.com/link?url=YmsOL4WW2NoQhbFCfX4DJtbrPKyTxorYAsXMB0CIIoB7o2KF15Mbqk...
原创
2589阅读
1评论
1点赞
发布博客于 2 年前

Noisex-92噪声库及100种环境噪声库

含有 NoiseX-92噪声库-完整版(wav格式): https://download.csdn.net/download/u012933021/10836240 以及(mat格式): http://spib.linse.ufsc.br/noise.html 100种环境噪声库: http://www.pudn.com/Download/item/id/3457634.html These nonspeech, environmental sounds can be used as nonspeech noises for evaluating speech segregation systems, among others. They are available in waveform, and can be downloaded in one ZIP file. The contents are: N1-N17: Crowd noise N18-N29: Machine noise N30-N43: Alarm and siren N44-N46: Traffic and car noise N47-N55: Animal sound N56-N69: Water sound N70-N78: Wind N79-N82: Bell N83-N85: Cough N86: Clap N87: Snore N88: Click N88-N90: Laugh N91-N92: Yawn N93: Cry N94: Shower N95: Tooth brushing N96-N97: Footsteps N98: Door moving N99-N100: Phone dialing
rar
发布资源于 2 年前

Timit语音库

本资源是Timit的部分语句,包含train中2580个句子,test中950个句子。 TIMIT 是sphere格式,不是wav格式,用python处理时要转换。 格式转换可以参考我的博客: https://blog.csdn.net/qq_34638161/article/details/89604212
rar
发布资源于 2 年前

python 录音、播放、写入语音

用python 读取并写入音频:import scipy.io.wavfile as wavfilepath = "sound/origin.wav"filepath_write = "sound/generate.wav"rate, data = wav.read(filepath)wav.write(filepath_write, rate, data)用 python 录...
原创
1686阅读
0评论
2点赞
发布博客于 2 年前

自然语言处理-NLP

书籍、论文、视频等--博客园:https://www.cnblogs.com/bnuvincent/p/4593849.html自然语言处理怎么最快入门?(知乎)https://www.zhihu.com/question/19895141GitHub 中视频课程:https://github.com/yandexdataschool/nlp_coursestanford ...
转载
202阅读
0评论
0点赞
发布博客于 2 年前

python 获取语音数据集 幅值的最大值

# coding=utf-8import osimport waviofiles_name = os.listdir('./datasets/100-Nonspeech/') # 返回文件或文件夹的名字# print(files_name)# os.system("pause")max_data = []max_set =1for i in range(100): ...
原创
838阅读
0评论
0点赞
发布博客于 2 年前

TIMIT数据集sphere格式转换为wav格式

使用python导入TIMIT的语音文件:wav_s=wavio.read("./datasets/timit/fdaw0/sa1.wav")报错:wave.Error: file does not start with RIFF id 或者其他报错:ValueError: File format b'NIST'... not understood.1、python...
转载
1863阅读
6评论
0点赞
发布博客于 2 年前

matlab:错误使用 fread 文件标识符无效。使用 fopen 生成有效的文件标识符。

fidin:-1.000000错误使用 fread文件标识符无效。使用 fopen 生成有效的文件标识符。出错 convert1 (line 12)A = fread(fidin,inf,'int16'); % 以二进制形式读取文件的全部数据,精度为16位整型% https://www.xuebuyuan.com/2053299.html% https://blo...
原创
34231阅读
0评论
5点赞
发布博客于 2 年前

python绘图不能显示中文及负数

添加下面两行:plt.rcParams['font.sans-serif']=['Simhei'] #解决中文显示问题,目前只知道黑体可行plt.rcParams['axes.unicode_minus']=False #解决负数坐标显示问题完整代码:# coding=utf-8from __future__ import division #必须放在最前面,division进...
转载
1322阅读
0评论
1点赞
发布博客于 2 年前

牛客网Python在线编程练习--知识点总结

sys.stdin.readline()和raw_input()的区别:sys.stdin.readline()会将标准的输入全部获取,包括末尾的'
';raw_input()获取的输入不包括换行符'
'。因此如果在平时使用sys.stdin.readline( )获取输入的话,不要忘了去掉末尾的换行符,可以用strip( )函数去掉(sys.stdin.readline( ).s...
原创
770阅读
0评论
0点赞
发布博客于 2 年前

如何引用 IEEE Xplore 中的文献

在IEEE Xplore Digital Library 中搜索需要的文献:https://ieeexplore.ieee.org/Xplore/home.jsp点击论文标题:点击右下角第二个,下载图标:Download Citations再点击 Download:弹出新的页面,得到下面信息:前两行即为引用文献的格式X. Xu, R. Flynn and...
原创
15306阅读
5评论
11点赞
发布博客于 2 年前

Autoencoder 自编码器

        自编码,又称自编码器(Autoencoder,AE),是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器内部有一个隐藏层h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数h = f(x) 表示的编码器和一个生成重构的解码器r = g(h)。  (百度百科)       作用:特征提取、数据降维、生成式建模      自编码器是一个3层或者...
转载
525阅读
0评论
1点赞
发布博客于 3 年前

MySQL数据库安装

*******************************************Linux下安装MySQL:*************************************************************************https://www.cnblogs.com/xinjing-jingxin/p/8025805.htmlhttps://www....
转载
133阅读
0评论
0点赞
发布博客于 3 年前

Cygwin编译器安装(C++)、Visual Studio 2017

http://www.cygwin.com/   (官网)Windows下安装Cygwin:(百度经验)https://jingyan.baidu.com/article/4f34706e0acca9e387b56dfe.html注意:安装后软件占用超过20G,磁盘满了,后来删除了。Visual Studio 2017 官网:https://visualstudio.mic...
原创
1884阅读
0评论
1点赞
发布博客于 3 年前

为什么TCP需要三次握手和四次挥手

TCP/IP协议 :  https://baike.baidu.com/item/TCP/IP协议  (百科)Transmission Control Protocol/Internet Protocol的简写,中译名为传输控制协议/因特网互联协议,又名网络通讯协议,是Internet最基本的协议、Internet国际互联网络的基础,由网络层的IP协议和传输层的TCP协议组成。TCP/IP 定义...
转载
129阅读
0评论
0点赞
发布博客于 3 年前

Python 列表(List) 的三种遍历(序号和值)方法、大小写字母转换

Python 列表(List) 的三种遍历(序号和值)方法:http://www.cnblogs.com/pizitai/archive/2017/02/14/6398276.htmlstring = sys.stdin.readline().strip().split() # <class 'list'>num = 0方法一:for i in string[0]:...
原创
6026阅读
0评论
0点赞
发布博客于 3 年前

python 读取数字、字符串

#coding=utf-8import sys# line= map(int,input("enter character:").split()) # 把一个字符串分割成字符串数组# split(" ")--按空格切分, strip()方法只能用于移除字符串 开头和结尾 指定的字符(默认为空格或换行符)或字符序列。aa=sys.stdin.readline().strip().sp...
原创
5168阅读
0评论
0点赞
发布博客于 3 年前

CNN中感受野

Receptive field(感受野) -- 简书https://www.baidu.com/link?url=9zupcdARKB_8BxdqYjdOgI8lNvUHHfvUFibYBqbbRaaYo-tKdPWFJGwRfOgjXxLD&wd=&eqid=a3194f1a001cba5c000000065bac7503云社区:https://www.baidu.c...
转载
177阅读
0评论
0点赞
发布博客于 3 年前

数据集 Data Set

THCHS-30 中文数据集 : (自己)https://blog.csdn.net/qq_34638161/article/details/82778392kaldi上第一个免费的中文语音识别例子: (中文)https://blog.csdn.net/wbgxx333/article/details/50634571今天在清华大学CSLT实验室王东老师的分享下,kaldi终于有了...
原创
1963阅读
0评论
0点赞
发布博客于 3 年前

LIBSVM Data: Classification (Multi-class)

图像分类数据集:https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html 
原创
207阅读
0评论
1点赞
发布博客于 3 年前

padding参数为 SAME 和 VALID 的区别

https://blog.csdn.net/wuguangbin1230/article/details/79218593https://blog.csdn.net/jiandanjinxin/article/details/77519629https://blog.csdn.net/wuzqchom/article/details/74785643不同的padding方式,VALID...
转载
5586阅读
0评论
2点赞
发布博客于 3 年前

RNN和CNN实现 MNIST手写字识别

https://www.cnblogs.com/denny402/p/5853538.html   (参考程序)https://www.baidu.com/link?url=8-IYA6LiH3bUaQoL3p1eLYnztDaEsb-I2R5mgY3jKuOLjl7FOJbHFqqw-iGlVfcV-pm4TdPX1etrTy1HNu_zFvE9zrHdbH7C6xc7zqOkQjO&amp...
转载
1081阅读
0评论
0点赞
发布博客于 3 年前

THCHS-30 中文数据集

Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库):https://blog.csdn.net/snowdroptulip/article/details/78943748THCHS-30:一个免费的中文语料库:https://blog.csdn.net/sut_wj/article/details/70662181语音识别工具Kaldi :https://b...
转载
9945阅读
4评论
0点赞
发布博客于 3 年前

python 处理数字,大于上限的数字置零

# coding=utf-8# 用来处理数字,大于上限的数字置零f = open("/home/chuwei/桌面/trainA/loss/d_losses.txt")line = f.readline()k = open("/home/chuwei/桌面/trainA/loss/d_losses_1.txt","a")while line: # print("line:",...
原创
1930阅读
0评论
0点赞
发布博客于 3 年前

Jetson TX1(视频)、TK1(音视频)

扩展板--I2S数字音频扩展NVIDIA Jetson TK1学习与开发:如何解决输入和输出音频问题:https://blog.csdn.net/FRD2009041510/article/details/44407633Jetson TK1:Tegra K1 片上系统 (SOC)     • 包含 192 个 CUDA 核心的 NVIDIA Kepler GPU     ...
转载
748阅读
0评论
0点赞
发布博客于 3 年前

KNN和K-Means

分类是指有监督的学习,即要分类的样本是有标记的,类别是已知的;聚类是指无监督的学习,样本没有标记,根据某种相似度度量把样本聚为k类。KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。https://baike.b...
转载
2132阅读
0评论
1点赞
发布博客于 3 年前

语音识别:HMM+GMM

隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模型。隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个...
转载
968阅读
0评论
0点赞
发布博客于 3 年前

梯度消失、梯度爆炸--解决办法

Batch Normalization -- 解决梯度消失问题Batch Normalization导读:https://blog.csdn.net/malefactor/article/details/51476961Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covaria...
转载
283阅读
0评论
0点赞
发布博客于 3 年前

《MATLAB在语音信号分析与合成中的应用》下载地址

https://pan.baidu.com/s/1qYIJ768?fid=425237463860437  (网盘)http://www.panduoduo.net/r/33607488matlab论坛:http://www.ilovematlab.cn/forum-6-1.html盘多多搜索:http://www.panduoduo.net/...
转载
4701阅读
12评论
5点赞
发布博客于 3 年前

module 'tensorflow' has no attribute 'absolute_import'

_init_.py中的语句# from tensorflow import *  改为from tensorflow.python import *module ‘XXX’ has no attribute ‘XXX’ 解决方案:(1)module未导入成功;(2)版本容错问题。参考博客:https://blog.csdn.net/u010801994/article/deta...
转载
426阅读
0评论
0点赞
发布博客于 3 年前

ImportError: cannot import name 'audio_ops' (TensorFlow)

tensorflow 报错:    from tensorflow.python.framework import ops as tf_ops    ImportError: cannot import name 'audio_ops'https://blog.csdn.net/KyrieHe/article/details/79540124解决办法: sudo pip3 insta...
转载
2611阅读
0评论
0点赞
发布博客于 3 年前

batch_size调参

谈谈深度学习中的 Batch_Size:https://blog.csdn.net/ycheng_sjtu/article/details/49804041深度学习中Batch_size相关问题汇总:https://www.baidu.com/link?url=yxvW5INV3lL-AMkMia8Gtaa7ux1O-hr4ZQLQQbaOEeWdBtCLArSbqaUG01Oq6JnE...
转载
430阅读
0评论
0点赞
发布博客于 3 年前

激活函数、优化算法

激活函数ReLU:https://www.cnblogs.com/makefile/p/activation-function.htmlReLU缺点:1,坏死:ReLU强制的稀疏处理会减少模型的有效容积(即屏蔽太多,导致模型无法学习到有效特征)。由于ReLU在x<0是梯度为0,这样导致负的梯度在这个ReLU被置零,而且这个神经元有可能再也不会被任何数据激活,称为神经元“坏死”;...
转载
213阅读
0评论
0点赞
发布博客于 3 年前

交叉熵与极大似然:

KL散度、交叉熵与极大似然:https://www.cnblogs.com/jenny1000000/p/7745458.htmlKL散度、交叉熵与极大似然:http://www.360doc.com/content/17/1105/09/31747150_701004922.shtml 
转载
711阅读
0评论
2点赞
发布博客于 3 年前

LSTM + CTC识别图片和数字

博客地址: https://blog.csdn.net/zchang81/article/details/77043628github地址:https://github.com/synckey/tensorflow_lstm_ctc_ocr这是一个使用 lstm 和 ctc 来 端到端 识别图片中序列数字的demo。识别图片和数字...
转载
2636阅读
0评论
0点赞
发布博客于 3 年前

windows7和ubuntu安装torch

ubuntu16.04安装torch:  Python2.7.14  (亲测)pip install  torch 下载torch,文件太大,复制下载地址到浏览器下载,速度快,而且不会断网后要重新下载。下载链接:  torch-0.4.1-cp27-cp27mu-manylinux1_x86_64.whl https://files.pythonhosted.org/package...
原创
2478阅读
0评论
0点赞
发布博客于 3 年前

安装scikits.audiolab ,语音识别

pip install  scikits.audiolab  会报错,缺少sndfile的包,先安装一下 sndfilesudo  apt-get  install  libsndfile-devpip  install  scikits.audiolab安装成功! Ubuntu,Python 3.6和Python 2.7都行; 我在windows7,Python3.6...
转载
1795阅读
1评论
0点赞
发布博客于 3 年前

End to End -- 端到端

机器学习策略-端到端学习:https://www.cnblogs.com/cloud-ken/p/7799946.html以前有一些数据处理系统或者学习系统,它们需要多个阶段的处理. 端到端学习就是忽略中间的过程用单个神经网络代替它。 从机器学习算法的发展 理解 端到端(end to end)学习:https://blog.csdn.net/weixin_37136725/ar...
转载
226阅读
0评论
0点赞
发布博客于 3 年前

为什么引入ReLU激活函数

https://blog.csdn.net/fredinators/article/details/79443386ReLu是神经网络中的一个激活函数,其优于tanh和sigmoid函数。1.为何引入非线性的激活函数?如果不用激活函数,在这种情况下每一层输出都是上层输入的线性函数。容易验证,无论神经网络有多少层,输出都是输入的线性组合,与没有隐藏层效果相当,这种情况就是最原始的感知机(...
转载
27550阅读
1评论
13点赞
发布博客于 3 年前

安装librosa

https://pypi.org/project/librosa/https://pypi.org/project/librosa/#files (下载)https://blog.csdn.net/qq_34638161/article/details/102923125conda install-cconda-forgelibrosa (可行)或者:pip in...
原创
3144阅读
2评论
2点赞
发布博客于 3 年前

神经网络中隐层数和隐层节点数问题

神经网络中隐层数和隐层节点数问题的讨论:https://www.baidu.com/link?url=jg1A6HCSEDkQcDNLvkRLjoq4KPgyY9u3dSFPvVpZ16SpRr2EeeVG_ucTYl0JguUUQYe_iuZ3JcbQF6RAtseXkU_ITn-PuzxErOZmxrJ-an3&wd=&eqid=e5c86d450000afd7000000...
转载
11027阅读
0评论
2点赞
发布博客于 3 年前

linux用户管理

用户账号管理:useradd  sky   #添加用户skyuserdel  sky   #删除用户skyuserdel  -r  sky   #删除用户及主目录usermod  选项 用户名passwd   sky    #修改密码groupadd  policeman  #添加组cat  /etc/passwd    #查看用户信息cat  /etc/group     #...
原创
60阅读
0评论
0点赞
发布博客于 3 年前

ubuntu安装flash player

sudo apt-get install flashplugin-installer安装了快一个小时 ubuntu如何安装 adobe flash player插件:(百度百科)https://jingyan.baidu.com/article/3c48dd34a2952ee10be35820.html...
转载
70阅读
0评论
0点赞
发布博客于 3 年前

ubuntu中pygame安装

安装命令:pip install pygame测试: Successfully loaded: saved_networks/network-dqn-200000下载pygamehttp://www.pygame.org/download.shtmlDebian、Ubuntu在线安装pip、安装pygame: (百度经验)https://jingyan.baid...
原创
1487阅读
0评论
0点赞
发布博客于 3 年前

ubuntu下安装pycharm

下载pycharm,我下载是Community,免费的https://www.jetbrains.com/pycharm/download/#section=linuxtar -xvzf pycharm-community-2018.1.tar.gz  -C  ~这里-C后的~即为文件解压路径,这里是解压到home下解压进入相应的文件夹然后进入bin如果pycharm.sh有权限...
转载
577阅读
0评论
0点赞
发布博客于 3 年前

ubuntu16.04 和18.04换源

第一步:备份原来的源文件sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup将sources.list备份到sources.list.backup第二步:替换源sudo gedit /etc/apt/sources.list替换阿里源第三步:更新源和软件sudo apt-get update s...
原创
1144阅读
0评论
0点赞
发布博客于 3 年前

将自己的 ubuntu 系统制作为ISO镜像

自己的Ubuntu做了很多设置,比如各种软件包,各种自定义的配置。如果想要在其他电脑上也安装一个一样的系统,可以制作ISO镜像。ISO镜像可以用于发布系统,也可以用来作为系统备份使用。以下是使用Systemback制作的ISO镜像:安装 Systemback:sudo add-apt-repository ppa:nemh/systembacksudo apt-get update &...
原创
33001阅读
9评论
13点赞
发布博客于 3 年前

ubuntu下制作u盘启动盘

https://blog.csdn.net/hp910315/article/details/77508575?locationNum=10&fps=1 :1.Ubuntu使用usb-creator工具制作U盘系统启动盘2.u盘制作工具unetbootinhttps://blog.csdn.net/l0605020112/article/details/20048899 :  ...
转载
3980阅读
0评论
0点赞
发布博客于 3 年前

ubuntu16.04没有声音

https://blog.csdn.net/weixin_36340947/article/details/78604865输入下面命令安装pavucontrol:#sudo apt install pavucontrol#pavucontrol点击Playback选项,将下面的Built-in Audio Analog Stereo修改为Logitech EasyCall Speake...
转载
823阅读
2评论
0点赞
发布博客于 3 年前

win7+ubuntu双系统删除ubuntu

我的电脑用windows引导ubuntu,直接删除ubuntu就行,然后在easyBCD中删除ubuntu,跳过启动菜单。删除后的分区可以用 DiskGenius 分区工具调整,比较好用。但是如果用ubuntu用GRUB引导windows,则需要先修复引导菜单。可以尝试用以下一种方法:     1,diskgenius中的“重建主引导记录MBR”; (有window...
转载
2839阅读
0评论
1点赞
发布博客于 3 年前

ubuntu下安装搜狗输入法

第一步:1.Ctrl+Alt+T,打开终端Terminal;2.先添加以下源,在终端输入命令:sudo add-apt-repository ppa:fcitx-team/nightly3.更新一下系统给,继续输入命令:sudo apt-get update4.安装fcitx,输入命令:sudo apt-get install fcitx5.安装fcitx的配置工具,输入命令:sudo ...
转载
175阅读
0评论
0点赞
发布博客于 3 年前

wine 安装(ubuntu中安装windows下软件)

wine  :能够在多种 POSIX-compliant 操作系统(诸如 Linux,Mac OSX 及 BSD 等)上运行 Windows 应用的兼容层https://baike.baidu.com/item/wine/2286934?fr=aladdin (百度百科)https://www.douban.com/note/146740895/   (豆瓣,win命令) 若你使用...
原创
87285阅读
1评论
11点赞
发布博客于 3 年前