数据:某地区近10年降水量
import pandas as pd
df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel
索引
import pandas as pd
df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel
数学统计
df.describe()#描述性统计
df["Specific Humidity"].mean()#值的平均数
df["Specific Humidity"].unique()#值的类型
df["Specific Humidity"].value_counts()#值出现多少次
df.cov()#协方差矩阵
df.corr()#相关系数矩阵
df["Relative Humidity"].corr(df["Specific Humidity"])#两个列的相关系数
查询
df.loc[(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#条件查询
df.loc[lambda df:(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#lambda函数多条件查询
新建列
df["hh哈"]=df["Relative Humidity"]-df["Specific Humidity"]#直接赋值新列
Temperature_type = lambda Temperature: '高温' if Temperature > 33 else ('低温' if Temperature < 10 else '常温')#lambda函数赋值
df['Temperature_type'] = df.apply(lambda row: Temperature_type(row['Temperature']), axis=1)#apply方法赋值列
df['Temperature_type'].value_counts()#计数
df['siducha']=''#新建列的一种方法
df.loc[df["Relative Humidity"]-df["Specific Humidity"]>10,"disucha"]="温差大"#按条件进行分组分别赋值
df.loc[df["Relative Humidity"]-df["Specific Humidity"]<10,"disucha"]="温差小"
df['disucha'].value_counts()#计数