python中用pd.read_excel()读取数据,数据类型是object类型,原因可能是包含空格或者非法字符,即非numeric数据类型,此时有两种方法查找空格
方法1:用excel表格查询,这种适合数据量少的文件,而且是因为空格导致的,空表格(不含任何字符)与含有空格字符的表格是有区别的,含有空格字符的表格左上角有绿色斜三角,因此你找到这种表格左上角含有绿色斜三角的格子,单击然后按下删除键,删除其中的空格字符
如果你没找到绿色斜三角,用鼠标点击任意空格,绿色斜三角就会显示出来
方法2 用python代码查询,我的数据集用excel打开表是这种
图中红色箭头所指的表格含有两个数字,并且用“,”隔开,这将导致该列(column)的数据类型是object,无法参与机器学习或其他数值计算
如何找出这种隐蔽的非法字符呢
我用jupyter notebook,先读取文件