一开始原数据读入后是二维数组的样子,每一行切词后的数据都存在列表里面。当执行fit_transform,报错‘list’ object has no attribute 'lower'
我将进行切词后的原数据进行保存,再重新读入就变成了一维数组,内部是字符串的样子
data.to_csv('Data_cut.csv',header=1,index=0)
data=pd.read_csv('Data_cut.csv',header=0)
data.info()
此时就得到的是一维数组,数组内每一项都是字符串的形式了。运行不会再报错,可以成功得到tfidf矩阵。