本赛季的数据位食物的声音识别,主要根据咀嚼食物时候发出的声音从而识别出相应的食物。主要分为20类,具体已经在task 1中写道。官方提供数据集为训练集和测试集。
官方的baseline 主要使用的方法为cnn。
因为baseline的特征提取主要用的MFCC,所以查了一下MFCC的相关概念
MFCC特征:基于人耳听觉特性提出来的,符 合人类的听觉特性,不仅能很好地度量语音频谱的 能量包络,同时倒谱运算具有良好的解卷性能,因此MFCC特征广泛地应用于情感语音识别、说话人识别、音频和音乐分类方面。
因为第一次以这种方式进行学习,又新颖又紧张,本次参加组队活动,希望自己可以不掉队就好。在不掉队的前提下,去完善和扩充自己的学习内容。