linux+pycharm+anaconda`
#两个series数据运算 + — × / **
num=pd.DataFrame([[1,2,3],[3,4,6]],columns=["数据一",'数据二','数据三'])
#加
num["数据一"]+num["数据二"]
#减
num["数据二"]-num["数据一"]
#乘法
num["数据三"]*num["数据一"]
#除法
num["数据三"]/num["数据一"]
#幂
num["数据三"]**num["数据一"]
#比较运算,返回bool值组成的series值
num["数据三"]>num["数据一"]
num["数据三"]<num["数据一"]
num["数据三"]==num["数据一"]
num["数据三"]!=num["数据一"]
#sum()求和对某与区域内数据进行累加
num.sum(axis=1)
num.sum(axis=0)
num["数据三"].sum()
#mena()求均值
num.mean(axis=1)
#求最大max()求最小min()
num["数据三"].min()
num.max(axis=0)
#求中位数
num.median(axis=1)
#众数
num.mode(axis=0)
num.mode()
#求方差
num.var(axis=1)
#标准差
num.std()
#四分位数
num.quantile(0.25)
num.quantile(0.75,axis=1)
#相关性运算
num["数据一"].corr(num["数据二"])
#两两间的相关性
num.corr()
data=pd.DataFrame([[20,99999,6],[30,999999,6],[20,999994],[27],[30,999999,6]])
data.columns=["年龄","收入","家属数"]
data.index=[i for i in range(5)]
#count运算,统计非空数据个数
data.count()
data["家属数"].count()
本文深入探讨了使用Python的Pandas库进行DataFrame数据运算的方法,包括加、减、乘、除等基本运算,以及求和、平均值、最大值、中位数、众数、方差、标准差等统计分析。通过具体实例,读者可以学习如何对数据进行高效处理和分析。
1559

被折叠的 条评论
为什么被折叠?



