前两天刚刚开始学习使用python,记录一下学习使用的第一个Pandas包。
安装Anaconda的同时,pandas已经自动安装好了,只需要import即可。如果不是使用Anaconda,可以通过pip安装。
首先它处理文件数据的功能比我想象的强大很多,一开始很多函数不了解,但大部分自己希望实现的功能都能够通过合理的使用函数来实现,这篇文章主要说一下遇到的问题和使用心得。
最基本的入门官方文档如下:
http://pandas.pydata.org/pandas-docs/stable/10min.html
我完成的第一个小任务是对一份车流量的csv文件进行处理,数据如下:
任务即统计不同时间段(日期/小时)内的车流量。
使用前
import pandas as pd
from pandas import Series, DataFrame
主要需要知道的是pandas的两种数据结构Series和DataFrame,分别类似于一维和二维数组,对于这两种类型可以查看数据的类型信息,使用info()函数。读取csv文件使用read_csv(文件名)函数。还可以调用describe()函数查看数值信息。
csvpd = pd.rea