Python list转DataFrame 出现None列

今天用python将list转为DataFrame时,出现了诡异的一幕,多了一列空列,源代码如下,(数据是UCI的开源数据,下载链接

def load_data(filepath):
    data= []  
    with open(filepath) as ifile:  
        for line in ifile:
            rowList = []
            tokens = line.strip().split('  ')#分割为两个空格(这行代码就是问题所在)
            for token in tokens:
                rowList.append(token)
            data.append(rowList)
            
    #将list转为Dataframe
    print(data)
    data=list(data)
    df=pd.DataFrame(data)
    print('-------------')
    print(df)
    return df
    
if __name__=='__main__':
    dataset=load_data("data/yeast.data")

打印的结果如下
在这里插入图片描述
一开始就怀疑是不是实际数据列数不止10,所以打印了第一行数据的列数,的确的10. 排查了半天,最后只有在循环中去拍段数据列数是不是等于10,不等于则打印。结果发现是因为,原始数据采用空格分割,有些是2个空格,有些是三个空格,因此分割会出现问题,如下
在这里插入图片描述
最后,我偷了懒,直接把数据分割换成了’,'号,就ok了。
在这里插入图片描述
希望能帮助到别人吧!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值