【正点原子i.MX93开发板试用连载体验】中文提示词的训练

神一样的老师

于 2024-08-05 07:59:16 发布

阅读量136

点赞数 4

分类专栏： i.MX 93开发板文章标签：嵌入式硬件单片机人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bit_mike/article/details/140906702

版权

i.MX 93开发板专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文首发于电子发烧友论坛：【正点原子i.MX93开发板试用连载体验】基于深度学习的语音本地控制 - 正点原子学习小组 - 电子技术论坛 - 广受欢迎的专业电子论坛!

好久没有更新了，今天再来更新一下。

我们用前面提到的录音工具录制了自己的中文语音，包括“打开”和“关闭”各100条，同时我们从谷歌的mini_speech_commands样本集里面随机挑选了100条作为"unknown”的样本，三个类别的数据个数要尽量相同，否则训练出来的结果会有倾向性。然后，开始自己的训练过程。

我所使用的是阿里云的PAI-DSW进行在线训练，平台的使用非常方便，避免了在本机上进行繁琐的设置工作。我采用的训练笔记本是TensorFlow的Simple audio recognition: Recognizing keywordssimple_audio_pi/simple_audio_train_numpy.ipynb

将脚本上传后，直接打开，就可以看到笔记本了。

笔记本的操作和其他平台差不多，就不详细介绍了。

我把准备的语音数据上传到data/speech目录下，共有3个子目录，分别是open、close和unknown。然后修改脚本中关于data_dir的设置。

`data_dir = pathlib.Path('data/speech')`

然后修改了训练集、验证集和测试集的数量设置。

train_files = filenames[:350] 
val_files = filenames[250: 250 + 100] 
test_files = filenames[-100:]

然后就按照笔记本里面的步骤执行就可以了。

数据量不大，训练只用了数秒就完成了。

使用一个样本进行测试，可以正确得到打开的结果。

最后可以得到tflite格式的文件，用于在开发板上的测试。

将tflite格式的文件拷贝到开发板上，并修改前面的测试程序中的模型文件路径和commands设置就可以使用中文的“打开”、“关闭”进行控制了。视频稍后将上传到B站，欢迎大家观看。

神一样的老师

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【正点原子i.MX93开发板试用连载体验】中文提示词的训练

我们用前面提到的录音工具录制了自己的中文语音，包括“打开”和“关闭”各100条，同时我们从谷歌的mini_speech_commands样本集里面随机挑选了100条作为"unknown”的样本，三个类别的数据个数要尽量相同，否则训练出来的结果会有倾向性。将tflite格式的文件拷贝到开发板上，并修改前面的测试程序中的模型文件路径和commands设置就可以使用中文的“打开”、“关闭”进行控制了。我所使用的是阿里云的PAI-DSW进行在线训练，平台的使用非常方便，避免了在本机上进行繁琐的设置工作。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。