背景
我拿原来的模型准备跑一个新数据集,当然列就会不同
新数据集没有head,我就自己傻乎乎一个一个数的列数(应该是数错了 我原来数的38其实是40)
就报了valueError: Length mismatch: Expected axis has 40 elements, new values have 38 elements
错误
解决思路
本人英语差所以谷歌翻译了一下这句话啥意思
valueError:长度不匹配:预期轴有 40 个元素,新值有 38 个元素
也就是说我数错了
为了证实那肯定要输出.shape结果是(100000,40)
行吧那我就认了 改吧就
数据处理解析
在拿到数据集最好先shape一下,看看到底多少行多少列
train_df=pd.read_csv('data/train_small.txt',header=None,sep='\t')
print(train_df.shape)
得出(10000,40)
对于没有head的数据集,需要给他定义一个头名
train_df.columns=['click']+['f'+str(i) for i in range(39)]
features=['f'+str(i) for i in range(39)]
就是这么简单
我哦这个写39是因为我前面那个是目标靶值 有个这个
错误原因
主要怪自己数数不会数
人家明确说了有40列 那你就别犟只有38列了 改就完事了 小错误 很简单 get