Pandas的安装比较容易,安装好Numpy之后,可以通过pip install pandas直接或者下载源码之后安装,但是默认的Pandas还不能读写Excel文件,需要安装xlrd(读),xlwt(写)库才能支持Excel的读写,方法如下:
pip install xlrd 为python添加读入Excel的功能
pip install xlwt 为python添加写入Excel的功能
简单操作代码如下:
#Pandas的简单例子,使用操作
import pandas as pd #通常用pd做pandas别名
s = pd.Series([1,2,3],index = ['a','b','c']) #创建一个序列s
d = pd.DataFrame([[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6]],columns = ['a','b','c']) #创建一个表格
d2 = pd.DataFrame(s) #也可以用已有序列创建表格
print(d.head()) #预览前五行数据
print(d.describe()) #数据基本统计量
#读取文件,注意文件的存储路径不能带有中文,否则读取可能出错
print(pd.read_excel('F:\data.xls')) #读取Excel文件,创建DataFrame
#运行出错,不知原因
#print(pd.read_csv('F:\data.csv',encoding = 'utf-8')) #读取文本格式数据,一般用encoding指定编码
pandas的基本数据结构是series和DataFrame