Task01：数据加载及探索性数据分析

最新推荐文章于 2024-10-01 05:04:32 发布

Carpe Diem_

最新推荐文章于 2024-10-01 05:04:32 发布

阅读量114

点赞数

分类专栏：八月学习文章标签： python

本文链接：https://blog.csdn.net/weixin_42348553/article/details/108105506

版权

八月学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

笔记

1.pandas.read_csv() 报错

pandas.read_csv() 报错 OSError: Initializing from file failed，一般由两种情况引起：一种是函数参数为路径而非文件名称，另一种是函数参数带有中文。
对于第一种情况很简单，原因就是没有把文件名称放到路径的后面，把文件名称添加到路径后面就可以了。
第二种情况，即使路径、文件名都完整，还是报错的原因是这个参数中有中文，但是Python3不是已经支持中文了吗？参考了错误原因和pandas的源码，发现调用pandas的read_csv()方法时，默认使用C engine作为parser engine，而当文件名中含有中文的时候，用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为Python就可以解决问题了。

da4=pd.read_csv('F:\\数据源\\工程清单.csv',engine='python')

对于第二种情况还有另外一种解决方法，就是使员工open函数打开文件，再取访问里面的数据：

da3=pd.read_csv(open('F:\\4.0 居配工程监测\\2.0 数据源\\02.南京新居配工程清单.csv'))

2.numpy中的axis

通过不同的axis，numpy会沿着不同的方向进行操作：如果不设置，那么对所有的元素操作；如果axis=0，则沿着纵轴进行操作；axis=1，则沿着横轴进行操作。但这只是简单的二位数组，如果是多维的呢？可以总结为一句话：设axis=i，则numpy沿着第i个下标变化的方向进行操作。
简要概括axis的用法是：假设axis = i，则numpy沿着第 i 个下标变化的方向进行操作

3.pandas中 inplace 参数理解

pandas 中 inplace 参数在很多函数中都会有，它的作用是：是否在原对象基础上进行修改
inplace = True：不创建新的对象，直接对原始对象进行修改；
inplace = False：对数据进行修改，创建并返回新的对象承载其修改结果。
默认是False，即创建新的对象进行修改。

4. drop函数的使用

删除行、列

print(frame.drop(['a']))
print(frame.drop(['b'], axis = 1))#drop函数默认删除行，列需要加axis = 1

5.reset_index(drop=True）

reset_index用来重置索引，因为有时候对dataframe做处理后索引可能是乱的。
drop=True就是dao把原来的索引index列去掉，重置index。
drop=False就是保留原来的索引，添加重置的index。

Carpe Diem_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录