1 数据运算
1.1 算数运算
#两列相加
import pandas as pd
df = pd.read_excel(r"./Data/4.xlsx",sheet_name = 0)
#添加行索引
df.index=["S1","S2","S3"]
df["C1"]+df["C2"]
#两列相减
df["C1"]-df["C2"]
#两列相乘
df["C1"]*df["C2"]
#两列相除
df["C1"]/df["C2"]
#任意一列加/减一个常数
df["C1"]+1
df["C1"]-1
1.2 比较运算符
import pandas as pd
df = pd.read_excel(r"./Data/3.xlsx",sheet_name = 0)
#添加行索引
df.index=["S1","S2","S3"]
df
df["C1"] > df["C2"]
df["C1"] < df["C2"]
df["C1"] != df["C2"]
1.3 汇总运算
count()非空值计数
非空值计数就是计算摸一个区域中非空数值的个数
默认是求每一列非空值的个数
修改axis=1可以计算每一行的非空值个数
import pandas as pd
df = pd.read_excel(r"./Data/Chapter08.xlsx",sheet_name = 0)
#添加行索引
df.index=["S1","S2","S3"]
#计算每一列的非空个数
df.count()
sum()求和
mean()求均值
求均值就是对某一区域中的所有值进行算数平均值运算
max()求最大值
min()求最小值使用方法和max()一致
median()求中位数
中位数就是将一组含有n个数据的序列X按照从小到大排列,位于中间位置的那个数,使用方法和其他函数一致
df.median()
mode()求众数
众数就是在一组数据中出现次数最多的数,使用方法与其他函数一致
var()求方差✩
方差是用来衡量一组数据离散程度的,使用方法与其他函数一致
std()求标准差✩
标准差是方差的平方根,二者都是用来表示数据的离散程度的,使用方法与其他函数一致
quantile()求分数位
分数位是比中数位更加详细的基于位置的指标,有四分之一分数位、四分之二分数位、四分之三分数位,而四分之二分数位就是中数位。
import pandas as pd
df = pd.read_excel(r"../Data/Chapter08.xlsx",sheet_name=2)
df.index=["S1","S2","S3","S4","S5"]
df
df.quantile(0.25)#求四分之一分数位
相关性运算符✩
相关性长用来衡量两个事之间的相关程度,用corr()函数
df.corr()