深度学习
绝版小哥
这个作者很懒,什么都没留下…
展开
-
语音数据增强算法汇总(附代码)
A summary of speech data augment algorithms语音数据增强算法汇总本项目已上传至Github:目录[音量增强](###1. 音量增强)[速度增强](###2. 速度增强)[音调增强](###3. 音调增强)[移动增强](###4. 移动增强)[噪声增强](###5. 噪声增强)5.1 [自然噪声](####5.1 自然噪声)5.2 [人工噪声](####5.2 人工噪声)[时域遮掩](###6. 时域遮掩)[频域遮掩原创 2020-11-20 15:57:24 · 11097 阅读 · 12 评论 -
论文阅读:《A Wavenet For Speech Denoising》
论文地址:A Wavenet For Speech Denoising项目地址:Github-speech-denoising-wavenet其他资料:演示地址摘要目前,大多数语音处理技术使用幅度谱图作为前端,因此默认放弃信号的一部分:相位。为了克服这一局限性,我们提出了一种基于Wavenet的语音去噪端到端学习方法。所提出的模型自适应保留了Wavenet强大的声学建模能力,同时通过消除其自回归特性,显著降低了时间复杂度。具体来说,该模型使用非因果膨胀卷积预测目标域,而非单一目标样本。我们提出.原创 2020-08-28 17:26:29 · 1733 阅读 · 0 评论 -
百度Paddle Paddle实战课程CV部分记录&心得
三、计算机视觉2.1 卷积2.6 Dropoutfluid.layer.dropout()训练和预测分布不一致的解决方法:downgrade_in_infer(默认),推断的时候把数值变小;upscale_in_train,训练的时候把保留的神经元数值放大;fluid.layer.dropout(x, dropout_prob=0.5, dropout_implementation='upscale_in_train', is_test=True)1. LeNet图片尺原创 2020-08-26 21:36:44 · 350 阅读 · 0 评论 -
基于百度PaddleHub实现视频/图片风格转换
百度PaddleHub官网stylepro_artistic模型介绍项目地址项目说明该项目基于百度PaddleHub提供的stylepro_artistic模型开发,实现将图片转换为多种绘画风格的功能。模型概述艺术风格迁移模型可以将给定的图像转换为任意的艺术风格。本模型StyleProNet整体采用全卷积神经网络架构(FCNs),通过encoder-decoder重建艺术风格图片。StyleProNet的核心是无参数化的内容-风格融合算法Style Projection,模型规模小,响应速度.原创 2020-08-26 18:53:43 · 1114 阅读 · 1 评论 -
Ubuntu 20.04安装CUDA 11
一、安装Nvidia显卡驱动由于Ubuntu软件和更新里的驱动不支持Cuda11,最高支持10.2,所以到Nvidia官网安装最新驱动,我的最新版本号是450.57。输入显卡信息,搜索搜索结果,下载下载完成后将文件移动到主目录下(别问为什么,后面就知道了),我放在主目录下。然后,请一次性看完并记住下面几步,或者用手机打开这条教程。打开终端(Ctrl+Alt+T)输入:sudo telinit 3然后你的电脑就关闭了图形界面,进入了tty界面输入用户名和密码。(注原创 2020-07-26 11:57:44 · 31887 阅读 · 16 评论 -
论文解读:《Linguistically Motivated Parallel Data Augmentation for Code-switch Language Model》
论文解读:《Linguistically Motivated Parallel Data Augmentation for Code-switch Language Model》《语言驱动的用于语码转换语言模型的并行数据增强》论文地址:Linguistically Motivated Parallel Data Augmentation for Code-switch Language Mo...翻译 2020-03-05 18:59:15 · 784 阅读 · 1 评论 -
论文解读——PVANet
原文:PVANet: Lightweight Deep Neural Networks for Real-time Object Detection要求:A. 先讲清楚论文的网络架构流程的核心思想(建议以图的形式展示);B. 再讲框架每一部分的细节;C. 最后讲实验的组织和结论。摘要:目标:降低计算成本内容:提出了一个比现有网络轻一个数量级的新型网络架构基本原则:多层少通道(m...原创 2019-11-17 11:37:32 · 499 阅读 · 0 评论 -
ASRT中文语音识别系统
系统流程1.特征提取输入:语音.wav操作:分帧加窗等操作输出:语谱图(二维频谱图像信号)2.声学模型参考VGG的深度卷积神经网络- 输入:语谱图- 操作:VGG模型训练- 输出:VGG输出3.CTC解码输入:VGG输出输出:汉语拼音序列4.语言模型基于概率图的最大熵隐马尔可夫模型输入:汉语拼音序列操作:隐含马尔可夫链输出:汉字文本无需...原创 2019-11-14 23:51:36 · 5284 阅读 · 8 评论