一次小的总结

Demo v1 我们第一次使用的模型是一个keras的Sequential 模型,简单来说就是将一些网络层堆积起来,已达到一个比较好的训练和识别效果。 具体看参照这一篇博客https://blog.csdn.net/c2c2c2aa/article/details/81543549 总体来说第一次...

2018-12-12 21:40:08

阅读数:10

评论数:0

识别特定语音信号

修改自己的pb文件位置,和args.list的大小即可使用 # -*- coding: utf-8 -*- """ Created on Sat Nov 10 16:59:03 2018 @author: chen "&am...

2018-11-14 19:59:45

阅读数:407

评论数:0

史上最简单的深度学习教程,带你快速入门深度学习———艺术风格化的神经网络算法

环境:win10,tensorflow1.9, github: 需要下载:github上的jupyter notebook文件,模型 代码效果如下: 代码如下 这里写代码片

2018-08-27 10:22:19

阅读数:93

评论数:0

语音识别与分类(三分类)

目的:识别三个单词(bed,cat,happy) github:https://github.com/yaokaishile/three-classification 一:导入需要的包 import librosa import os from sklearn.model_selection...

2018-08-17 20:19:41

阅读数:448

评论数:0

Batch_Size简单理解

batchsize的正确选择是为了在内存效率和内存容量之间寻找最佳平衡 相对于正常数据集,如果Batch_Size过小,训练数据就会非常难收敛,从而导致underfitting。 增大Batch_Size,相对处理速度加快。 增大Batch_Size,所需内存容量增加(epoch的次数需要增...

2018-08-17 15:34:56

阅读数:28

评论数:0

权重和偏置的简单理解

y=ax+b a就是权重,b就是偏置

2018-08-11 12:27:03

阅读数:511

评论数:0

卷积输出图像的大小计算

输入图像:n*n, 过滤器:f*f 步长:s, padding:p 输出图像大小为:⌊(n+2p−fs+1))⌋∗⌊(n+2p−fs+1)⌋,⌊⌋表示向下取整

2018-08-11 11:13:19

阅读数:105

评论数:0

librosa,melspectrogram初阶

import librosa import librosa.display y, sr = librosa.load('E:\\ML\\UrbanSound8K\\code\\UrbanSound8K\\audio\\fold1\\31840-3-0-0.wav', duration=2.97) ...

2018-08-11 10:29:01

阅读数:300

评论数:0

一、YouTube-8M 初探(视频与音频分类)

不建议在win10上跑,最好使用ubuntu。 下载数据集 # Video-level mkdir -p ~/yt8m/v2/video cd ~/yt8m/v2/video curl data.yt8m.org/download.py | shard=1,100 partition=2/vi...

2018-08-09 22:14:11

阅读数:424

评论数:0

语音分类任务(基于UrbanSound8K数据集)

一、代码构思 二、代码实现 三、完整代码 四、github地址 环境:win10,python3,tensorflow1.9 语音方面的资料不如图像识别的多,所以特地写了一份博客(并不如何严谨),希望可以帮到大家。github地址在文末,后续可能会录制视频讲解(不过估计没有时间)。 我...

2018-08-09 21:02:51

阅读数:633

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭