pandas 基础函数

Pandas是什么,简单来说就是把Excel的表格观念丢到Python来,你在Excel所有的操作都可以透过Pandas的函式做处理。

Pandas 背后的数据都是使用numpy 的array 。

为什么不用python内建的List?

因为python的List ,里面不同的数据笔的数据有不同的数据形态,例如第一个是string,第二个是integer,第三个是float使得python运算效率低。

Python list转换成numpyarray 后是单一形态,float,或者 string

Pandas主要有两大数据结构:

1.  Series字段(一维度)

2.  DataFrame表格(二维度)

3.  Panel三维表格(除了特殊需求之外少使用… 略过)

 

DataFrame基本信息

后续会使用iris数据集,我们可以透过info以及describe来观看表格的信息,info主要可以看有几笔资料、每个字段的数据型别是什么(int,float..)、有无空值(null)的存在、占据多少内存,describe主要是看数据的平均值、分布情况、是否有资料倾斜Skew的问题。



 

 



阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页