语音前端
文章平均质量分 52
RoadmanG
英国留学四年,音频算法工程师,主要研究方向在去混响,深度学习单/多通道降噪和回声消除
展开
-
换工作咯,准备开源能开源的项目
跳槽咯,去做音频工程相关,觉得自己工程太弱了,的确需要去好好磨一下自己的代码。 在新公司以后没啥机会再做算法了,可能做2年看看后面是不是再做算法。准备把之前自己实现的能开源的代码都开源出来,包括1. conferencingspeech2021我们拿到第三名的模型代码2. aec的所有线性滤波自己复现的代码(matlab)3. 深度学习ai-aec的所有代码,模型就用conferencingspeech的模型好了4. chime6我们第六名的前端数据增强和推理阶段分离代码等。原创 2021-12-22 17:56:40 · 539 阅读 · 0 评论 -
信号的卷积和互相关matlab代码实现
最近要做一些传统算法的操作,复习一下信号的基础自己实现了一下信号基础的两个操作:卷积和互相关这两个操作可谓是遍布了所有传统音频信号处理算法的基础.去混响啊,波束形成啊,回声消除啊到处见.所以一定要自己实现一遍加深了解网上对于这两个概念的数学解释和物理解释很多,大家可以去了解一下,我就只给大家提供代码参考代码具体参考 matlab信号卷积和互相关简单总结一下卷积:两个信号,一个信号先翻转再做"CNN"的卷积操作, 即移位乘积和相关:类似"CNN"的卷积操作,直接移位乘积和我原创 2021-09-03 11:45:20 · 1439 阅读 · 0 评论 -
tensorflow在不同gpu上在加载libcuda,libcufft等库慢
最近在做一些工程部署工作,遇到写坑,写些解决办法记录一下:C由于CUDA的JIT Compile(即时编译)机制,是为了应对未来没发布的gpu硬件时也能顺滑的让程序在新的gpu上优化.原创 2021-09-03 11:07:59 · 573 阅读 · 0 评论 -
深度学习aec数据前处理脚本,基于timit和汪德亮老师的paper
该脚本基于Deep Learning for Acoustic Echo Cancellation in Noisy and Double-TalkScenarios中汪德亮老师学生中对timit的处理会生成几个数据集1. 远端语音信号2. 进场语音信号3. 回声4. 近端麦克风接受信号具体的repo连接: dnn_aec_data_process这个脚本需要整理一下,但具体功能是实现完了, 有一些点比如说加噪的时候的归一化和线性放大放小这个可能需要做个实验看看有没有原创 2021-06-30 20:59:16 · 757 阅读 · 10 评论 -
RNNOISE 16K音频训练方式
鉴于很多同学都在问RNNoise如何把48k的原始代码改成能训练16k音频的,我就把我做的rnnoise 16k的一些小改动开源出来, 一起探讨研究。先mark, 后面详细来介绍如何改,代码已经放上了githubRNNoise_16k 训练代码https://github.com/YongyuG/rnnoise_16k有问题请提出来,1年多前的东西,很多代码都没整理...原创 2020-04-20 19:36:52 · 4287 阅读 · 48 评论 -
谱减去混响方法----附上matlab 代码 (已更新,贴上了代码和论文, 新增split_frame和overlapadd代码)
鉴于有人要求stft和istft代码,我就把它贴出来,之前不贴出来是因为很多人stft和istft是不一样的,而且实时跟离线算法的stft跟istft在实现上也是有点不同的,你可以用自己的,也可以用我的,但思路和结果都是一样的.还有一个朋友直接要求发代码去您个人邮箱,您可真是牛逼,代码都已经贴出来了,可以直接复制粘贴,整理一下,这几分钟的事情,你都懒得做,那我觉得也没什么好说的,毕竟我只是想记...原创 2019-09-25 10:43:38 · 4476 阅读 · 9 评论 -
RNNoise要注意的部分(草稿记录)
rnnoise会有一个pitch_filter这是由于因为它们在生成特征时不是用频域上所有频点,而是采取bark's scale的切分频段来对不同频率的频段进行特征处理这样的话频域上的分辨率会降低,然后导致最后在进行降噪后生成的语音会有一个现象就是oversmoothing,即你会辨别不清共振峰.尽管bark's scale 在低频部分的频段分得很细,但是他把好几个频率都归为一个频带,...原创 2019-06-27 17:10:22 · 3831 阅读 · 35 评论