1.声音是如何产生的:
声音以波的形式传播,即声波(Sound Wave)。当我们以波的视角来理解声音时,却又大繁若简起来:仅凭频率(Frequency)、 幅度(Magnitude)、相位(Phase)便构成了波及其叠加的所有,声音的不同音高(Pitch)、音量(Loudness)、音色(Timbre) 也由这些基本“粒子”组合而来。
2.赛题数据集:
声音分类在很多场景中都有大模型的应用,例如对音乐的分类可以应用于音乐检索和音乐推荐中; 对人声的分类可以应用在身份识别、智能家居中。本比赛的背景是食物的声音的分类,是一个充满趣味性的任务。
3.赛题数据探索过程:
1.加载库:
Python有一些很棒的音频处理库,比如Librosa和PyAudio,还有一些内置的模块用于处理音频的基本处理。
2.查看音频数据:
音频文件夹的个数: 20
音频文件总量: 7000
序号 类别 数量 占比
0 cabbage 329 4.70%
1 noodles 251 3.59%
2 chocolate 178 2.54%
3 grapes 345 4.93%
4 gummies 446