2022年10月29日 团队报名了第七届NVIDIA SKy Hackathon大赛并于2022年11月28日成功完赛
本次系列比赛为团队第二次参加,在有了一定经验的情况下,本次团队也取得了一定的成绩(大赛第四名),而本人主要在团队内负责的是ASR相关模型的训练及调参,故本篇文章主要为ASR模型的相关介绍以及团队在训练过程中遇到的比较经典的问题及解决方案。
目录
3.2.1 RuntimeError: CUDA out of memory.
3.2.2 在已安装了CUDA的情况下,运行代码时检测CUDA 为False
(一)大赛简介
本次参赛题目:
挑战智能语音垃圾分类任务
题目背景:
垃圾是世界范围内日益严重的环境问题,实行垃圾分类,关系节约使用资源,也是社会文明水平的一个重要体现。NVIDIA正在努力加强技术研究,致力于开发创新计算解决方案,同时鼓励开发者们利用NVIDIA 各种AI开发工具,激发创造力,科技赋能,给垃圾分类注入“智慧力量”。
大赛目的:
本次Hackathon活动以“挑战智能语音垃圾分类任务”为主题。赛事涵盖:语音识别、垃圾检测及用户接口的web页面实现等。并将所有功能部署到 jetson NX上
图1-1 本次大赛项目流程 注:图片来源NVIDIA针对于本次比赛的培训ppt
大赛内容:
- 语音识别:通过NEMO将语音结果转化为文字
- 图像识别:通过文字对图片进行识别(banana、cardboard、bottle)
- 网页显示:将语音识别结果、图像识别结果显示在制作的网页上
(二)相关环境配置(初始环境及ASR相关环境)
本次NVIDIA还是很贴心的为参赛人员准备了配置环境的知识图谱,便于初学或第一次参赛的同学安装配置本次大赛所需的环境。
接下来将应用本次NVIDIA Sky Hackathon的知识图谱相关内容便于读者参考阅读:
A1. 获取NGC秘钥
- 1.创建NGC账号:这个帐号与NVIDIA Developer账号是独立的,需要单独申请。如果已经有NGC帐号的,请跳过下面申请的流程,直接到第2步“创建NGC密钥”
- 登录 https://ngc.nvidia.com 会直接出现 CATALOG画面
- 请点击下图右上角 ”Welcome Guest”,然后点选下方 ”Sing in/Sing Up”
3.进入后点选 ”NVIDIA Account” 旁边的”Continue”,就会进入下图右的“登陆”或“创建一个账户”的画面,然后按照标准开帐户的流程执行就可以。
- 2.获取NGC密钥:
- 登陆NGC,点选右上角用户名,在下拉菜单中选择 ”setup” 选项
2.进入下面选项后,点击 ”Get API Key”
在下面点击右上角”Generate API KEY”会跳出“确认”,点击”confirm”就可以
生成的这组密钥在整个训练过程以及最后推理时都需要用到,非常关键。由于密钥只有在创建时候能看到内容,日后无法在NGC独立查询,请自行复制做好记录。
在https://docs.nvidia.com/ngc/ngc-overview/index.html有NGC更完整说明。
A2. 安装NVIDIA驱动460以上版本
$ $ $ $ |
sudo apt-get install software-properties-common sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt-get install nvidia-driver-460 sudo reboot # 重启之后才会生效,重启后执行 nvidia-smi 检查驱动 |