wav读取优化

19 篇文章 0 订阅

耗时分析:

在windows上进行耗时分析

1. 一个线程读取数据并fft

条件

读取,并fft。

对一个wav文件的处理过程包括:

  1. 读取头文件,
  2. 读取数据部分得到3个数组
  3. 把得到的3个数组分别fft

结果

对步骤1-3执行的时间和1-3总时间统计如下
在这里插入图片描述
一个文件的处理一共花费4238ms,主要花费在读取文件数据部分上(3522ms)

2. 一个线程不断读取并fft并保存

条件

不断读取,并不断fft,并不断保存。

如果所有逻辑用一个线程完成如下逻辑:

  1. 从文件名获取fft后的数组(即上面的3个步骤)
  2. 将数组保存

(同时,使用另一个线程不断寻找新的wav文件。)

结果

费时情况:
在这里插入图片描述
也就是说,第一步(读取并fft)耗时4464ms,第二步(保存)耗时119ms,一共4584ms

3. 用三个线程分别读取、fft、保存

3个线程分别完成:读取(3522ms),fft(713ms),保存(119ms)。
(同时,使用另一个线程不断寻找新的wav文件。)

没有做实验,但是花费时间由慢的线程决定,所以理论上费时3522ms

4. 一点疑问

在windlws读取一个wav文件需要3.5s,但是我以前在kuiper测试的时候,处理一个wav文件都只要1.1s。
读取wav文件命名时kuiper中sources的一个步骤,不知道为什么kuiper这么快?
难道是linux系统的io比较快?

5. 总结

像要加快处理速度,需要改写读取wav的数据的代码。

读取wav的数据部分耗时最长,是fft的5倍,所以最好是能缩短时间。
fft耗时较长,但是应该不能改写了,因为计算量大,费时正常。
所以要想办法改写读取wav数据的代码。


现在读取wav的数据部分的逻辑是每次读取两字节,然后把这两个字节转换为int,也就是说一次只读取一个int,要读取468750次。
如果一次读取wav的所有数据,内存也放得下,时间也可以缩短。

修改读取文件部分代码

1. 修改方法:

更改 myreader.go,读取一次返回原始数据 [][]int32
更该 fft,原来接收[[]float64, 现在接收[]int32
更改主程序,不要再用for循环读了。

2. 修改后各部分用时:

在这里插入图片描述
在这里插入图片描述

读取wav的数据:44ms
对所有通道fft:750ms
保存:123ms。

所以现在的瓶颈是fft了。以前也有人测试过fft:
在这里插入图片描述

他的104万费时378ms
我又测试了104万是,费时517ms,我的52万,费时250ms(750/3),比他的略差

我用的fft算法使用的是复数,复数可能有额外开销,刚好还有一个实数版本的fft,也拿来试一下。

改写fft代码

1. 改写过程

  1. 编写新的myfft( []float64) []float64
  2. 编写Myf( []int32)[]float64,这个函数会把输入扩充为2^n的float数组,然后调用myfft()
  3. 改写Getfft_nd(string) [][]float64,这个函数使用新的读取文件方法和新的fft方法

2. 结果

在这里插入图片描述
对于104万的数据
用我的fft只需要234ms

在这里插入图片描述
对于52万数据
用我的fft只需要91ms

3. 总结:

目前三部分理论用时为:
读取数据:44ms
对所有通道fft:91ms*3=273ms
保存:123ms。
在这里插入图片描述

在这里插入图片描述

顺便列出我的程序逻辑,方便改写为kuiper插件

涉及3个包

wav
	负责读取wav,和上一版本相比,增加了两个函数,用来一次性读取wav数据
myfft
	fft算法,提供Getfft_nd(string) [][]float64方法,输入地址,输出多通道的fft结果。和上一版本相比,完全不同
daomain
	主程序,一个线程不断寻找wav文件,另一个线程拿到地址,依次读文件,fft,储存。

4. 后期改进空间

要改进的话可以改写主程序,用3个线程分别完成读文件,fft和储存这三个任务。
现在耗时492ms,改进后理论耗时300ms。

fft基本达到瓶颈了,不可能更快了

移植到ubuntu系统

在这里插入图片描述
用时582ms,费时比windows(492)稍长。

移植到Kuiper

移植过程

需要改写function和source
readWavA3.go
row2fft5.go

注意sources不能返回int32的map,只能返回float64的map

速度测试

26个文件9s,大概一个文件340ms,

性能:

前:
在这里插入图片描述

中:
在这里插入图片描述
在这里插入图片描述

后:
在这里插入图片描述

内存占用0.3g,cpu占用挺高

### 回答1: 使用C#语言编写的Winform程序可以通过引用NAudio库来读取WAV文件并绘制时域图。下面是一个简单的步骤: 1. 首先,确保已在Visual Studio中创建了一个Winform项目,并在项目中添加了NAudio库的引用。 2. 在Winform界面中添加一个按钮和一个PictureBox控件,用于选择WAV文件和显示时域图。 3. 当用户点击按钮时,可以使用 OpenFileDialog 控件来选择 WAV 文件,并获取所选文件的路径。 4. 使用 NAudio 库中的 WaveFileReader 类,用于读取 WAV 文件中的音频数据。创建一个 WaveFileReader 对象,并将选定的 WAV 文件路径作为参数传递给它。 5. 使用 NAudio 库中的 WaveBuffer 类和 WaveFileReader 的 Read 方法来读取 WAV 文件中的音频数据。将读取的音频数据存储在一个数组中。 6. 创建一个 Bitmap 对象,用于绘制时域图。可以根据需要设置图片的大小。 7. 将读取的音频数据绘制到 Bitmap 上,可以使用 Graphics 对象的 DrawLine 方法。根据音频数据的振幅值来绘制水平线,从而形成时域图。 8. 将 Bitmap 对象绘制到 PictureBox 控件上,以显示时域图。 综上所述,使用 Winform 和 NAudio 库可以实现读取 WAV 文件并绘制时域图的功能。这是一个简单的实现示例,还可以根据需求进一步完善和优化。 ### 回答2: WinForm 是一种应用程序开发框架,用于创建 Windows 平台上的图形用户界面。要在 WinForm 程序中读取 WAV 文件并绘制时域图,可以使用 NAudio 这个开源音频库。 首先,在 WinForm 程序中添加一个按钮和一个用于显示时域图的控件(例如 PictureBox)。当用户点击按钮时,触发事件处理程序。 在事件处理程序中,首先需要使用 OpenFileDialog 控件来让用户选择 WAV 文件。通过调用 OpenFileDialog.ShowDialog() 方法来显示文件选择对话框,然后获取用户选择的文件路径。 读取选定的 WAV 文件,可以使用 NAudio 库中的 WaveFileReader 类。通过创建 WaveFileReader 对象,并传递 WAV 文件的路径作为参数,然后调用 WaveFileReader.Read() 方法来读取音频数据。 将读取到的音频数据转换为时域数据,可以使用 NAudio 的 WaveToSampleProvider 类。通过创建 WaveToSampleProvider 对象,并将 WaveFileReader 对象作为参数传递,然后调用 WaveToSampleProvider.ToSampleProvider() 方法来获取 SampleProvider 对象。 创建一个数组来存储读取到的时域数据,使用 SampleProvider 的 Read() 方法来读取并将数据存储在数组中。 最后,使用图形库(如 System.Drawing)来绘制时域图。通过创建 Graphics 对象,并使用 Graphics.DrawLines() 方法来绘制时域图。 将绘制好的时域图显示在 WinForm 窗口中的 PictureBox 控件上,可以使用 PictureBox.Image 属性来设置时域图。 以上就是使用 WinForm 读取 WAV 文件并绘制时域图的基本步骤。通过使用 NAudio 音频库和图形库来实现,可以让 WinForm 程序具有功能丰富的音频处理和图形绘制能力。 ### 回答3: 在Winform中读取和绘制WAV文件的时域图可以通过以下步骤实现: 1. 在Winform中创建一个PictureBox控件,用于显示绘制的时域图。 2. 使用System.IO命名空间中的FileStream类打开WAV文件,以便读取其内容。例如,可以使用以下代码进行文件打开操作: ```csharp FileStream fs = new FileStream("audio.wav", FileMode.Open); ``` 3. 读取WAV文件的文件头信息,通常可以通过读取前44个字节来获取。WAV文件的文件头包含采样率、声道数、位深度等相关信息。 4. 读取WAV文件的音频数据。根据文件头信息获取的采样率、声道数和位深度,可以计算出每个采样需要读取的字节数。根据这些信息,使用BinaryReader类读取剩余的音频数据。 5. 将读取到的音频数据转换为时域图所需的绘图数据。可以使用NAudio库进行音频数据的转换和处理。 6. 使用GDI+绘制时域图。根据音频数据得到的振幅值,将其映射到PictureBox的像素坐标中,然后使用Graphics类的DrawLine或DrawRectangle等方法绘制时域图。 7. 在绘制完成后,关闭文件流和释放资源。 以上是在Winform中读取和绘制WAV文件的时域图的大致步骤。具体实现还需要根据具体情况进行一些细节的处理,例如错误处理、界面布局等。同时,还可以根据需求添加一些其他的功能,如缩放、标尺等,以提升用户体验和功能性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值