pandas的基本操作

一.准备

准备工作:我们需要装好pandas库,然后引入它,一般简写为pd

import pandas as pd

二.基本操作

1)生成一个表格

方法一:pd.DataFrame() #三个参数,第一个为填入的值,第二个index为表格的行标,第三个columns为表格的列标。第二三个参数如果不填则默认从0开始一直排下去。

#方法一直接使用np
df = pd.DataFrame(np.arange(12).reshape((3,4)),columns=['a','b','c','d'])  #index表示列标,columns表示行标
    a	b	c	d
0	0	1	2	3
1	4	5	6	7
2	8	9	10	11

方法二:可以使用字典生成表格

#方法二可以导入字典,键表示列标,值表示这一列对应的所有值
df1 = pd.DataFrame({'A':1.,
                   'B':pd.Timestamp('20210129'),
                   'C':pd.Series(1,index=list(range(4)),dtype='float32'),
                   'D':np.array([3]*4,'int32'),
                   'E':'foo'})
     A	   B   	     C	D	 E
0	1.0	2021-01-29	1.0	3	foo
1	1.0	2021-01-29	1.0	3	foo
2	1.0	2021-01-29	1.0	3	foo
3	1.0	2021-01-29	1.0	3	foo

2)操作函数

#生成从20210129开始显示时间的六个字符串
dates = pd.date_range('20210129',periods=6)

在这里插入图片描述

操作函数作用
df.index返回表格df的行标
df.columns返回表格df的列标
df.values返回表格df的值
df.dtypes返回表格df每列的类型
df.T转置表格df

注意: df是一个实例

3)describe()

df1.describe()  #对有数据的那几列进行描述,求得其平均值,最大最小值等等
       A	C	D
count  4.0	4.0	4.0
mean   1.0	1.0	3.0
std	0.0	0.0	0.0
min	1.0	1.0	3.0
25%	1.0	1.0	3.0
50%	1.0	1.0	3.0
75%	1.0	1.0	3.0
max	1.0	1.0	3.0

4)其他函数

 #排序,axis为1对列标进行排序,0对行标进行排序,ascending为True为正序,若为False则为倒序
df1.sort_index(axis=1,ascending = False) 
#对指定的一列数值进行排序
df1.sort_values(by='A') 
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

比奇堡咻飞兜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值