Task01:数据加载及探索性数据分析

笔记

1.pandas.read_csv() 报错

pandas.read_csv() 报错 OSError: Initializing from file failed,一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有中文。
对于第一种情况很简单,原因就是没有把文件名称放到路径的后面,把文件名称添加到路径后面就可以了。
第二种情况,即使路径、文件名都完整,还是报错的原因是这个参数中有中文,但是Python3不是已经支持中文了吗?参考了错误原因和pandas的源码,发现调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为Python就可以解决问题了。

da4=pd.read_csv('F:\\数据源\\工程清单.csv',engine='python')

对于第二种情况还有另外一种解决方法,就是使员工open函数打开文件,再取访问里面的数据:

da3=pd.read_csv(open('F:\\4.0 居配工程监测\\2.0 数据源\\02.南京新居配工程清单.csv'))

2.numpy中的axis

通过不同的axis,numpy会沿着不同的方向进行操作:如果不设置,那么对所有的元素操作;如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:设axis=i,则numpy沿着第i个下标变化的方向进行操作。
简要概括axis的用法是:假设axis = i,则numpy沿着第 i 个下标变化的方向进行操作

3.pandas中 inplace 参数理解

pandas 中 inplace 参数在很多函数中都会有,它的作用是:是否在原对象基础上进行修改
​ inplace = True:不创建新的对象,直接对原始对象进行修改;
​ inplace = False:对数据进行修改,创建并返回新的对象承载其修改结果。
默认是False,即创建新的对象进行修改。

4. drop函数的使用

删除行、列

print(frame.drop(['a']))
print(frame.drop(['b'], axis = 1))#drop函数默认删除行,列需要加axis = 1

5.reset_index(drop=True)

reset_index用来重置索引,因为有时候对dataframe做处理后索引可能是乱的。
drop=True就是dao把原来的索引index列去掉,重置index。
drop=False就是保留原来的索引,添加重置的index。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值