pandas 数据计算,格式化

import pandas as pd
data=[[11,22,22],[11,22,99],[77,11,99]]
index=['a','b','c']
columns=['aa','bb','cc']
df=pd.DataFrame(data=data,index=index,columns=columns)
print(df)
#数据计算
#print(df.sum(axis=1))    # 求和,axis=1计算行,0计算列
print(df.mean())     #求平均值     默认为0计算列
#print(df.max())     #最大值
#df=df.append(df.max(),ignore_index=True)       #增加一行时要加ignore_index=true来忽略索引
#print(df)     
#print(df.median())      #中位数
#print(df.mode())      #每列中的众数   默认为0计算列
#print(df['cc'].mode())   #某列的众数
#print(df.var())     #求方差
#print(df.std())     #标准差
#df.quantile(0.35)       #分位数   35%     计算日期,时间和时间增量数据的分位数加参数numeric_only=False
#数据格式化
import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.random([5,5]),columns=['a1','a2','a3','a4','a5'])    #5行5列
print(df)
#print(df.round(2))     #保留2位小数
#print(df.round({'a1':1,'a2':2}))    #指定某列保留位数
#s1=pd.Series([1,0,2],index=['a1','a2','a3'])
#print(s1)
#print(df.round(s1))      #通过series是指位数
#df['百分比']=df['a1'].apply(lambda x:format(x,'.0%'))       #整列保留0位小数      #设置百分比用apply()和format()  格式难记。。。
#df['百分比']=df['a1'].map(lambda x:'{:.0%}'.format(x))      #同上,改用map
#print(df)
#还有个设置千位分隔符,估计用不上,先不学了
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值