pandas架构学习

df=pd.dataFrame(data=‘数据的内容’,columns=[‘行标题1’,‘行标题2’],index=i)

list(zip(‘复合数据1’,‘复合数据2’))

df.value():值
df.ix[行范围, 列范围]
df.loc[起始索引(包含):终止索引(包含)]
df.iloc[起始索引(包含):终止索引(不包含)]

选择 top-N 个记录 (默认是 5 个)

df.head()

选择 N-bottom 个记录 (默认是 5 个)

df.tail()

把列(column)放置到索引位置

df.stack()

在索引包含了原来的列名字
df.stack().index
拆解列字符索引
df.unstack()
在这里插入图片描述
创建一个 groupby 对象
df.grouby(‘abc’)
在这里插入图片描述

设置默认行序号:as_index=False
在这里插入图片描述
删除索引e
df.drop(‘e’)

数学运算:
加法:add()
减法:sub()
乘法:mul()
除法:div()
中位数:median()
求和:sum()
最大值:max()
最小值:min()

在这里插入图片描述
df2.sort_values(by=‘age’) # 按 age 升序排列
直接修改值的大小:
df3.iat[1, 1] = 2
以时间为序号
pd.date_range(start=‘2018-01-01’, end=‘2018-12-31’, freq=‘D’)

转换时区
tz_localize(‘UTC’)

letters = ['A', 'B', 'C']
numbers = list(range(20))

mi = pd.MultiIndex.from_product([letters, numbers])  # 设置多重索引
s = pd.Series(np.random.rand(60), index=mi)  # 随机数

多重索引切片:
s.loc[pd.IndexSlice[:‘B’, 5:]]
更改列名称:
frame.index.names = [‘first’, ‘second’]

将priority列的yes改为Ture,no改为False
df[‘priority’].map({‘yes’: True, ‘no’: False})

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值