Python pandas库的Series与DataFrame常用命令详细讲解!

Python pandas库的Series与DataFrame常用命令详细讲解!

1,开发工具

工具:jupyter notebook

2,pandas数据结构之Series

Series类型是一组数据及与之相关的数据索引组成 .
1,不指定索引创建Series

import pandas as pd
import numpy as np

#简单的分析pd.Series传递的参数,data=传递的列表数据,index=第一列的索引可以不传递默认生成根据自己的需要设置
data =pd.Series(range(1,6))
data

在这里插入图片描述
2,指定索引创建Series

data =pd.Series(data=[9,8,7,6],index=['a','b','c','d'])
data

在这里插入图片描述

3,pandas数据结构之DataFrame

DataFrame是表格型类,可理解为二维表数据类型,index(axis=0),colum(axis=1)

1,不指定列名创建DataFrame

#简单的分析pd.DataFrame传递的参数,data=传递的数据一般为字典
#(里面包含迭代器(列表)),index=第一列的索引可以不传递默认
#生成根据自己的需要设置
d={
    '姓名':['ganxiang','king','jack','brian','tony'],
    '年龄':[21,21,22,22,21],
    '学号':[11,10,12,13,14]
}
#pd.DataFrame(columns=,index=,data=,)columns指定列名默认可以不指定
#以传递的字典key为列名,index指定第一列索引默认从0开始,
#data为必须指定数据
#一般为字典,字典内可以为key:列表,key:str)
data =pd.DataFrame(data=d,index=['a','b','c','d','e'])
data

在这里插入图片描述
2,指定列名创建DataFrame

#指定columns,columns为列表不管有多少列按列表的写法,传递的数据为字典
#指定列名一定要与字典的key值相同
d={
    '姓名':['ganxiang','king','jack','brian','tony'],
    '年龄':[21,21,22,22,21],
    '学号':[11,10,12,13,14]
}
data =pd.DataFrame(data=d,index=['a','b','c','d','e'],columns=[ '姓名','年龄','学号'],dtype=str)
data

在这里插入图片描述
3,将DataFrame里面的数据列和行互换

print("将DataFrame里面的数据列和行互换:\n",data.T)

在这里插入图片描述
4,通过多维数组方式创建DataFrame,需要制定列索引,行索引可默认.

#通过多维数组方式创建DataFrame,需要制定列索引,行索引可默认
d=[['ganxiang', '21', '11'],
       ['king', '21', '10'],
       ['jack', '22', '12'],
       ['brian', '22', '13'],
       ['tony', '21', '14']]
f =pd.DataFrame(np.arange(12).reshape((3,4)),columns=['a','b','c','d'])
f

在这里插入图片描述
5,获取DataFrame里面的数据前n行,默认获取为前五行。

d={
    '姓名':['ganxiang','king','jack','brian','tony','erick'],
    '年龄':[21,21,22,22,21,20],
    '学号':[11,10,12,13,14,15]
}
#获取DataFrame里面的数据前n行,默认获取为前五行
df =pd.DataFrame(data=d,index=['a','b','c','d','e','f'],columns=[ '姓名','年龄','学号'],dtype=str)
print("head()默认打印前五行:\n",df.head())

在这里插入图片描述
6,获取DataFrame里面的数据后n行,默认获取为后五行

#获取DataFrame里面的数据后n行,默认获取为后五行
print("#获取DataFrame里面的数据后n行,默认获取为后五行:\n",df.tail(2))

在这里插入图片描述
7,获取DataFrame里面的所有数据,返回 DataFrame 的 Numpy 格式

#获取DataFrame里面的所有数据,返回 DataFrame 的 Numpy 格式
print("获取DataFrame里面的所有数据:\n",df.values)

在这里插入图片描述
8,获取DataFrame里面的所有列名,返回数据DataFrame 行

#获取DataFrame里面的所有列名,返回数据DataFrame 行
print("获取DataFrame里面的所有列名:\n",df.columns)

在这里插入图片描述
9,取DataFrame里面的某一列数据

#获取DataFrame里面的某一列数据
print("获取DataFrame里面的某一列数据:\n",df['姓名'])

在这里插入图片描述
10,获取DataFrame里面的某一列数据并指定数据读取

#获取DataFrame里面的某一列数据并指定数据读取
print("1,获取DataFrame里面的某一列数据并指定数据读取:\n",df['姓名'][2:5])
print("\n 2,获取DataFrame里面的某一列数据并指定数据读取:\n",df['姓名'][2])

在这里插入图片描述
11,根据整数访问行和列的单个值,类似二维数组访问数据,iat取某个单值,只能数字索引

#根据整数访问行和列的单个值,类似二维数组访问数据,iat取某个单值,只能数字索引
print("iat根据整数访问行和列的单个值\n",df.iat[0,0])

在这里插入图片描述
12,at取某个单值,只能index和columns索引

#at取某个单值,只能index和columns索引
print("at取某个单值,只能index和columns索引:\n",df.at['a',"姓名"])

在这里插入图片描述
13,shape返回数据 DataFrame 维数的元组(行和列的数量)

#shape返回数据 DataFrame 维数的元组(行和列的数量).
print("返回数据 DataFrame 维数的元组(行和列的数量):\n",df.shape)

在这里插入图片描述
14,size返回DataFrame 元素数量

#size返回DataFrame 元素数量
print("size返回DataFrame 元素数量:\n",df.size)

在这里插入图片描述
15,dtypes返回数据 DataFrame 的 dtypes.

#dtypes返回数据 DataFrame 的 dtypes.
print("dtypes返回数据 DataFrame 的 dtypes:\n",df.dtypes)

在这里插入图片描述
16,读取某几行数据

#读取某几行数据
print("读取某几行数据:\n",df.ix[1:3])

在这里插入图片描述
17,读取某几列数据,loc第一个参数为行名,第二个参数为列名,loc只能通过index和columns来取,不能用数字

#读取某几列数据,loc第一个参数为行名,第二个参数为列名,loc只能通过index
#和columns来取,不能用数字
print("读取某几列数据:\n",df.loc['a':'f','姓名'])

在这里插入图片描述
18,读取某几列数据,iloc只能用数字索引,不能用索引名

#读取某几列数据,iloc只能用数字索引,不能用索引名
print("读取某几列数据:\n",df.iloc[0:6,0])

在这里插入图片描述
到此pandas的Series与DataFrame的常用命令学习完成!

点赞再走呗🤞🤞🤞

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值