tensorflow训练自己的声音数据集进行声音分类

**

tensorflow训练自己的声音数据集进行声音分类

**

环境 win10
anaconda3.5
tensorflow 2.0

1.安装anaconda
https://pan.baidu.com/s/1XeFxohUN10FPV1QF3E-X5w 密码:i60b

  1. 创建虚拟环境
    conda create -n tensorflow python=3.7
  2. 启动虚拟环境
    conda activate tensorflow
    4.安装 tensorflow2.0
    pip install tensorflow==2.0
    无法下载需要修改默认路径
  3. 安装 librosa
    pip install librosa
    中间可能会失败,多安几次,如果还是失败需要下载安装
    https://pan.baidu.com/s/1VWvw_CNApqCwpG0VmR-z3g 密码:37ib
    cd librosa-0.8.0
    python setup.py install
    如果报错 Failed to build pyaudio
    需要安装pyaudio
    https://pan.baidu.com/s/1XryzOc1p7N0mHnmNaLvckw 密码:proh
    pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl
    pip install pydub

试一下
(tensorflow) F:\Tensorflow>python
Python 3.7.10 | packaged by conda-forge | (default, Feb 19 2021, 15:37:01) [MSC v.1916 64 bit (AMD64)] on win32
Type “help”, “copyright”, “credits” or “license” for more information.

import tensorflow
exit()
6.下载程序
https://pan.baidu.com/s/12B95Qwvlx8msIeuotLvCkg 密码:ja6n

将自己的图像按照分类放到文件夹,将所有文件夹放到audio文件夹
7.运行程序 进行训练
cd AudioClassification
python train.py

(tensorflow) F:\Tensorflow\AudioClassification>python train.py
2021-03-22 14:54:14.428562: I tensorflow/core/platform/cpu_feature_guard.cc:142] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
Model: “sequential”


Layer (type) Output Shape Param #

resnet50v2 (Model) (None, 4, None, 2048) 23558528


activity_regularization (Act (None, 4, None, 2048) 0


dropout (Dropout) (None, 4, None, 2048) 0


global_max_pooling2d (Global (None, 2048) 0


dense (Dense) (None, 10) 20490

Total params: 23,579,018
Trainable params: 23,533,578
Non-trainable params: 45,440


Batch 0, Loss 1.945332, Accuracy 0.187500
Batch 20, Loss 3.135965, Accuracy 0.312500
Batch 40, Loss 4.096233, Accuracy 0.531250
Batch 60, Loss 2.204610, Accuracy 0.500000
Batch 80, Loss 3.273754, Accuracy 0.687500
Batch 100, Loss 1.581592, Accuracy 0.906250
Batch 120, Loss 2.359572, Accuracy 0.750000
Batch 140, Loss 4.610085, Accuracy 0.593750
Batch 160, Loss 2.782383, Accuracy 0.718750
Batch 180, Loss 2.560995, Accuracy 0.812500
Batch 200, Loss 2.664778, Accuracy 0.812500

Test, Loss 2.782835, Accuracy 0.833333

Batch 220, Loss 3.542227, Accuracy 0.781250

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
使用TensorFlow Lite可以快速构建移动端声音分类应用。TensorFlow Lite是一个针对移动设备和嵌入式设备优化的轻量级机器学习框架,它具有高效的推理性能和较小的模型尺寸。 首先,我们需要准备声音分类训练数据集。可以选择一个合适的公开数据集,例如UrbanSound8K,其中包含了来自不同环境的各种声音样本。然后,我们使用TensorFlow构建和训练一个声音分类模型,可以选择常见的模型架构,如卷积神经网络。 接下来,我们使用TensorFlow提供的工具将训练好的模型转换为TensorFlow Lite的模型格式。这可以通过使用TensorFlow的Converter API实现,其中应用了优化技术来减小模型的尺寸和优化推理性能。 一旦我们获得了TensorFlow Lite模型,我们可以将其集成到移动端应用程序中。可以使用Java或Kotlin编写Android应用,或使用Swift编写iOS应用。在应用程序中,我们使用TensorFlow Lite解析器来加载模型并进行声音分类。该解析器提供了简单的API来输入音频数据并获得分类结果。 最后,为了提高移动端应用的性能,可以考虑对模型进行量化(quantization),将浮点数模型转换为整数模型,以减小内存占用和加速推理速度。TensorFlow Lite还提供了一些优化技术,如模型矩阵压缩和模型分割,进一步提升了性能。 总之,使用TensorFlow Lite可以快速构建高性能、低资源占用的移动端声音分类应用。通过合理选择数据集训练模型,并应用TensorFlow Lite的优化技术,我们可以在移动设备上实现实时声音分类

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值