深度学习的第一步恐怕就是读数据了,数据集有很多种,有的数据集训练数据和标签是分开的并且有的数据集标签里有很多数据,需要提取标签里面有效的内容;有的数据集文件名即标签,下面以读取语音数据集为例,为大家介绍。
1 数据集文件名即为标签,如图所示
import os
import pandas as pd
feeling_list=[]
for item in mylist:
if item[:1]=='a':
feeling_list.append('angry')
elif item[:1]=='f':
feeling_list.append('fear')
elif item[:1]=='h':
feeling_list.append('happy')
elif item[:1]=='n':
feeling_list.append('neutral')
elif item[:2]=='sa':
feeling_list.append('sad')
elif item[:2]=='su':
feeling_list.append('surprise')
labels = pd.DataFrame(feeling_list)
###读取语音特征MFCCS
df &