机器学习python中用pd.read_excel()读取数据,数据类型是object类型,即非numeric数据类型,此时有两种方法查找非法字符

python中用pd.read_excel()读取数据,数据类型是object类型,原因可能是包含空格或者非法字符,即非numeric数据类型,此时有两种方法查找空格
方法1:用excel表格查询,这种适合数据量少的文件,而且是因为空格导致的,空表格(不含任何字符)与含有空格字符的表格是有区别的,含有空格字符的表格左上角有绿色斜三角,因此你找到这种表格左上角含有绿色斜三角的格子,单击然后按下删除键,删除其中的空格字符
如果你没找到绿色斜三角,用鼠标点击任意空格,绿色斜三角就会显示出来
在这里插入图片描述
方法2 用python代码查询,我的数据集用excel打开表是这种
在这里插入图片描述
图中红色箭头所指的表格含有两个数字,并且用“,”隔开,这将导致该列(column)的数据类型是object,无法参与机器学习或其他数值计算
如何找出这种隐蔽的非法字符呢
我用jupyter notebook,先读取文件

在这里插入图片描述

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值