【modlearts】华为人工智能平台_modelarts平台系列教程2_自动学习_声音分类(3)


前言

华为modelarts训练,能够面向三类用户提供解决AI开发支持。对于无AI基础的业务开发员,可以使用自动学习模型。全程无需写代码,一键启动训练&部署。对于AI初学者,使用预置的算法,少量的代码即可调用。对于AI深度完结,可以使用modlearts内置的notebook,自研的MoXingSDK,简化代码。
在这里插入图片描述

ModelArts自动学习是帮助人们实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。自动学习功能根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型。开发者无需专业的开发基础和编码能力,只需上传数据,通过自动学习界面引导和简单操作即可完成模型训练和部署。

当前自动学习支持快速创建图像分类、物体检测、预测分析、声音分类和文本分类模型的定制化开发。可广泛应用在工业、零售安防等领域。

图像分类:识别图片中物体的类别。
物体检测:识别出图片中每个物体的位置和类别。
预测分析:对结构化数据做出分类或数值预测。
声音分类:对环境中不同声音进行分类识别。
文本分类:识别一段文本的类别。


1.数据准备

声音分类的数据要求
1.音频只支持16bit的WAV格式。支持WAV的所有子格式。
2.单条音频时长应大于1s,大小不能超过4MB。
3.适当增加训练数据,会提升模型的精度。声音分类建议每类音频至少50条,每类音频总时长至少5分钟。
4.建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。
5.训练集的数据质量对于模型的精度有很大影响,建议训练集音频的采样率和采样精度保持一致。
6.标注质量对于最终的模型精度有极大的影响,标注过程中尽量不要出现误标情况。

2.创建项目

选择声音分类
在这里插入图片描述

3.数据标准

选择未标注音频。在“数据标注”页面单击“未标注”页签,此页面展示所有未标注的音频数据。依次单击选中待标注的音频,或勾选“选择当前页”选中该页面所有音频,在页面右侧进行标注。
在这里插入图片描述
添加标注。先对音频进行播放识别,然后选中音频文件,在右侧“标签”区域,输入“标签名”或从下拉列表中选择已添加的标签,同时可在下拉菜单中选择标签“快捷键”。单击“确定”,完成选中音频的标注操作。
在这里插入图片描述
当目录中所有音频都完成标注后,您可以在“已标注”页签下查看已完成标注的音频,或者通过右侧的“全部标签”列表,了解当前已完成的标签名称和标签数量。
在“自动学习”页面,单击项目名称,进入自动学习“数据标注”页面。声音分类项目创建时,音频来源有两种,通过本地添加或同步OBS中的数据。
添加音频:您可以将本地音频快速添加到ModelArts,同时自动上传至创建项目时所选择的OBS路径中。单击“添加音频”,在弹出的对话框中单击“添加音频”并添加。
说明:
仅支持16bit WAV格式音频文件,单个音频文件不能超过4MB,且单次上传的音频文件总大小不能超过8MB。

数据源同步:为了快速获取用户OBS桶中最新音频,单击“数据源同步”,快速将通过OBS上传的音频数据添加到ModelArts。
删除音频:您可以依次单击选中音频,或勾选“选择当前页”选中该页面所有音频进行删除操作。
说明:
所有的删除操作均不可恢复,请谨慎操作。

4.训练模型

完成音频标注后,可进行模型的训练。模型训练的目的是得到满足需求的声音分类模型。由于用于训练的音频,至少有2种以上的分类,每种分类的音频数不少于5个。因此在发布训练之前,请确保已标注的音频符合要求,否则下方“开始训练”按钮会处于灰色状态。
在这里插入图片描述

5.部署上线

部署上线操作即将模型部署为在线服务,并且提供在线的测试UI与监控能力。完成模型训练后,可选择准确率理想且训练状态为“运行成功”的版本部署上线。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值