- 编程学习
(1)板坯在辊道上传动-宽厚板厂(引用python的librosa库对.wav音频文件进行波形处理)
(2)除鳞喷水
简单了解了librosa库,接下来更深入学习。
2. Tensorflow(keras)、多层感知器(神经网络)、多个神经元(多分类)
在Anaconda GPU、Pycharm环境下,以CIFAR10_CNN和FASHION_CNN数据集学习五种神经网络。卷积计算可对图片进行特征提取方法,同样也可以对音频进行特征提取,卷积算法中,最大池化可以提取图片纹理,均值池化可以保留背景特征。在音频中,原始波形为输入的一维卷积神经网络,二维卷积神经网络以频域特性作为输入,并且, python中librosa包可进行音频分析,该软件包设计用于分析音乐和音频文件,用于提取音频功能和开发信息可视化。先在pycharm中实现五种神经网络对两种图片的预测模型,通过loss和acc曲线进行比较学习。(LeNet、AlexNet、VGGNet、InceptionNe、ResNet)
经过学习发现,ResNet 网络的运行速度更慢,但是精准率较高,在第三次迭代的时候已经达到了93%。怎样选取最优神经网络,以及怎样设置最优相关参数,怎样将钢厂相关音频处理用神经网络解决,还没想好具体的应用。通过查看文献以及相关的资料,现在对于图像处理和识别的技术研究相对成熟,图像和音频有相似之处,音频可用图像、数据以及其他的形式表现,
接下来,将特征提取的相关算法实现,并且完成相关实例仿真,继续阅读特诊提取、特征选择相关文献以及异常声音的检测算法和相关文献。继续学习python的librosa库对音频进行相关处理。