我参加 NVIDIA Sky Hackathon--- 浅谈数据集处理的心得和教训

目录

赛事题目:挑战智能语音垃圾分类任务

ASR 语音数据集

音频采样

语音数据集制作流程

踩坑 & 建议:

CV 图像数据集

图像搜集

图像数据集制作

踩坑 & 建议

心得体会

建立范式

团队协作

探索试点


赛事题目:挑战智能语音垃圾分类任务

垃圾是世界范围内日益严重的环境问题,实行垃圾分类,关系节约使用资源,也是社会文明水平的一个重要体现。

NVIDIA 正在努力加强技术研究,致力于开发创新计算解决方案,同时鼓励开发者们利用 NVIDIA 各种 AI 开发工具,激发创造力,科技赋能,给垃圾分类注入 “智慧力量”。

本次 Hackathon 活动以 “挑战智能语音垃圾分类任务” 为主题。

赛事涵盖:语音识别、垃圾检测及用户接口的 web 页面实现等。

图 1-1 - 第七届黑客松比赛应用流程图
图 2-1-Audacity 界面截图

ASR 语音数据集

音频采样

录制工具:Audacity

音频要求:①录制声道:立体声

②项目采样率:44100HZ

③音频格式:wav

(图 2-1 红色圆圈标记为①②设定处)

按钮解释 (参见矩形方框):

①红色:开始录制

②蓝色:结束录制

③黄色:播放音频

图 2-1-Audacity 界面截图

音频内容: 语句公式:请检测出 rubbish

依据比赛任务要求,rubbish 共有三类:瓶子、纸箱、果皮

语音数据集制作流程

图 2-2-ASR 音频数据集制作流程图

向 jupyter notebook 中导入音频(建议新建一个文件夹,专门用于存储音频)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值