零基础学pandas第一天

最新推荐文章于 2024-07-27 12:20:46 发布

且看行云

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量85

点赞数

文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/m0_65560393/article/details/129478743

版权

数据：某地区近10年降水量

import pandas as pd

df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel

索引

import pandas as pd

df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel

数学统计

df.describe()#描述性统计
df["Specific Humidity"].mean()#值的平均数
df["Specific Humidity"].unique()#值的类型
df["Specific Humidity"].value_counts()#值出现多少次
df.cov()#协方差矩阵
df.corr()#相关系数矩阵
df["Relative Humidity"].corr(df["Specific Humidity"])#两个列的相关系数

查询

df.loc[(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#条件查询


df.loc[lambda df:(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#lambda函数多条件查询

新建列

df["hh哈"]=df["Relative Humidity"]-df["Specific Humidity"]#直接赋值新列
Temperature_type = lambda Temperature: '高温' if Temperature > 33 else ('低温' if Temperature < 10 else '常温')#lambda函数赋值
df['Temperature_type'] = df.apply(lambda row: Temperature_type(row['Temperature']), axis=1)#apply方法赋值列
df['Temperature_type'].value_counts()#计数

df['siducha']=''#新建列的一种方法
df.loc[df["Relative Humidity"]-df["Specific Humidity"]>10,"disucha"]="温差大"#按条件进行分组分别赋值
df.loc[df["Relative Humidity"]-df["Specific Humidity"]<10,"disucha"]="温差小"
df['disucha'].value_counts()#计数