pandas 基础函数

Pandas是什么,简单来说就是把Excel的表格观念丢到Python来,你在Excel所有的操作都可以透过Pandas的函式做处理。

Pandas 背后的数据都是使用numpy 的array 。

为什么不用python内建的List?

因为python的List ,里面不同的数据笔的数据有不同的数据形态,例如第一个是string,第二个是integer,第三个是float使得python运算效率低。

Python list转换成numpyarray 后是单一形态,float,或者 string

Pandas主要有两大数据结构:

1.  Series字段(一维度)

2.  DataFrame表格(二维度)

3.  Panel三维表格(除了特殊需求之外少使用… 略过)

 

DataFrame基本信息

后续会使用iris数据集,我们可以透过info以及describe来观看表格的信息,info主要可以看有几笔资料、每个字段的数据型别是什么(int,float..)、有无空值(null)的存在、占据多少内存,describe主要是看数据的平均值、分布情况、是否有资料倾斜Skew的问题。



 

 



阅读更多
个人分类: anaconda
上一篇Anaconda win10X64 fail to open next available port
下一篇panda资料前处理
想对作者说点什么? 我来说一句

PANDAS 思维导图

2017年12月05日 2.37MB 下载

python安装pandas

2017年11月10日 164KB 下载

Pandas 官方教程

2017年06月23日 1.4MB 下载

pandas 中文手册

2017年09月13日 2.88MB 下载

没有更多推荐了,返回首页

关闭
关闭