使用Jupyter Notebook导入csv数据时的一个错误

项目场景:

使用Jupyter Notebook导入csv数据时的错误


问题描述:

前两天学了几个机器学习的模型,今天想拿kaggle上的数据集练练手,然后开开心心的打开jupyter,正准备一展身手时,结果刚开始导入数据集就把我整懵了。 一般我都是习惯直接那pandas的read_csv,先把文件upload到工作目录下

在这里插入图片描述
代码里直接上,先引个包,然后就开始读,读完好像没啥问题,打印出来看看吧,嚯!这可把我吓坏了

import pandas as pd
data = pd.read_csv("clinvar_conflicting.csv")
data

在这里插入图片描述

这是个啥东西?特征不像特征,标签不像标签的。定睛一看,好像是吧我的第一行当作列名了。hhh
然后网上各种找解决方案,又是改编码,又是修改属性,结果这个bug没解决,又冒出来好多bug,比如UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd4 in position 3: invalid continuation byte,UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd4 in position 3: invalid continuation byte。。。搞得我心态有点崩了

然后我再看看数据集,拿excel打开,完完整整,没啥问题

在这里插入图片描述
拿记事本打开,emmmm。。。好像有点小问题,第五行那里为啥是dGen啥的开头,不应该是一个数字吗,,拉到最后一看,原来是上一行太长了,结果换行了,hh

在这里插入图片描述
在这里插入图片描述

我心里一想不对啊,我刚才那spyder是呢一遍也打开了呀,不信你看
在这里插入图片描述
这到底是为啥呢?
然后我还仔细看了看数据,诶?好像有的数据怪怪的,比如这个应该是一个字段下的,用“”包在一起的字符串,但是字符串里有,,难道是jupyter按照字符串里的逗号分隔了??仿佛自己知道了天机,然后又是一顿操作猛如虎,各种找资料,还是解决不了。然后我又看一眼jupyter的数据,哦,好像jupyter已经解决了这个问题了,我是zz。
然后我看了kaggle上其他人的代码,人家这不是好好的吗?难道我用了个假python???
在这里插入图片描述
最后气得我直接在jupyter打开看文件,好家伙,这是啥啊,咋少了这么多数据呢???
在这里插入图片描述
怪不得我刚才在jupyter里上传的时候命名30多兆的文件到这里就只剩5兆了
在这里插入图片描述
好吧,我明白了,是不是只要我把路径改为绝对路径就好使了?
在这里插入图片描述
芜湖!果真,,,,终于导进来了!
(红warning可以参考这个https://www.cnblogs.com/bigtreei/p/10496740.html)
接下来就可以愉快的coding了!!!
呜呜呜呜呜,就这个小bug弄了一下午,程序员长路漫漫啊。
在这里插入图片描述

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值