问题目前是想从一个以列为样本,每列长度不一样的数据集中导出每一个样本,然后循环文件名读取文件进行特征提取,但是输出的特征数据集文件是空的,什么都没有。
开始以为是Utf-8格式问题,后来加了,encoding='utf-8'
然后问题没有解决。
解决办法:
最后通过以下代码发现每个样本中有空值,然后通过pandas中的dropna()删除了空值,axis=0#在循环中删除空值所在行,默认axis=0;如果axis=1代表列
然后问题解决!
df=pd.read_csv(r'C:\Users\狮子天予\Desktop\test\sample1.csv',header=None)
df
text=text.dropna()#在循环中删除空值所在行,默认axis=0;如果axis=1,代表列