pandas 是一套用于 Python 的快速、高效的数据分析工具。它提供了数组的操作,定义了处理数据的基本结构,并且赋予了它们促进操作的方法,例如:读取数据、调整索引、使用日期和时间序列、排序、分组、一般数据调整、处理缺失值等等。
总之,学好pandas,数据分析也就不用怕了。
从本篇开始,J哥将系统总结pandas所有常用和实用知识点,所有code都是手码。至于要写多少篇,以最终code量来决定。学习本系列前建议下载安装Jupyter Notebook。
一、数据包
二、Series
由 pandas 定义的两种数据类型是 Series 和 DataFrame,Series 类似一个 column,DataFrame 是多个 Series 的集合。
1.定义一个Series
注:np.random.randn()函数随机返回一个或一组样本,具有标准正态分布
2.Series乘以10
3.Series取绝对值