1.pandas库安装导入
windows下和linux下都可以使用pip安装,安装之前最好把pip升级到最新版
python -m pip install --upgrade pip
pip install pandas
import pandas as pd
2.常用方法介绍
函数 |
说明 |
pd.Series() |
一维数据结构 |
pd.DataFrame() |
二维数据结构(可以理解为表格结构) |
pd.Panel() |
三维数据结构 |
dict={
'数学':90,'语文':80,'英语':100}
dicts1=pd.Series([1,2,3,4,5])
dicts2=pd.DataFrame(dict,index=['小明','小刘','小王'])
dicts1
0 1
1 2
2 3
3 4
4 5
dtype: int64
dicts2
数学 语文 英语
------------------
小明 90 80 100
小刘 90 80 100
小王 90 80 100
函数 |
说明 |
pd.read_csv(‘date.csv’) |
读取.csv的文件 |
pd.read_excel(‘date.xlsx’) |
读取.xlsx文件,需要单独安装此模块 |
date.columns |
输出所有的列,也就是第一行 |
date.index |
输出表的总行数 |
date.reindex([a,b,c,d,e],method=‘bfill’) |
reindex修改列值(索引列表),method设置前填充(ffill)或者后填充(bfill) |
date.values |
打印所有行列对应的数据 |
date.head(2) |
打印数据的头2行 |
date·.tail(2) |
打印数据的后2行 |
date.loc[] |
行和列的引用 |
date.iloc[] |
行和列的引用 |
date.T |
翻转行和列 |
date.sort_index(axis=0/1,ascending = True/False) |
1是横向排序,0是纵向排序,True是升序,False是降序 |
date.sort_values(by =" ",ascending = True/False) |
以行里某个列排序可以按照多列排序,True是升序,False是降序 |
data=pd.read_csv('data.csv')
data
id key value
-------