pandas库
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
导入pandas库
Pandas 库里有两个常用数据对象:Series 和DataFrame
创建对象
我们先看下创建DataFrame的动作
我们再来看看pd.DataFrame 的一些默认值
还可用字典来创建
创建一个Series
内置的一些方法
先创建一个DataFrame
列的名字
所有的值
总体的看下数据
按照纵坐标排序,或者横坐标排序,axis=1 则是横坐标,反之
索引,定位
先创一个DataFrame
可以单独看看A列
使用索引值
**
用loc函数
**
很强大,很方便的loc
查询起来很方便
总之loc函数是通过横纵坐标的具体值来定位
再看看通过索引定位的iloc
额。。。这个还有混合的,也就是索引和值混合用!太猛了!
还能做条件定位
改齐其中的值
数据清洗
当表格中有nan的情况:
删掉nan
把所有的nan变为你想要的值
如果数据量过大,可以直接查询有没有数据丢失
导入导出
导入导出的放法,用变量名接住就行
数据合并
先看三列数据
学了上面的应该知道他们现在的样子吧
合并(当列相同的情况下)
合并(当列不相同的情况下)
DataFrame 合并Series
有关联的数据块合并:
==合并》
通过两个关联项合并
==合并》
看看上面的haw ,可以灵活的合并出你想要的结果
合并之后如何快速查看数据呢?
先创建两个数据项
如果你没有用jupyter那么你会需要下面这个函数
先创建数据
OK