零基础学pandas第一天

数据:某地区近10年降水量

import pandas as pd

df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel

索引
 

import pandas as pd

df = pd.read_excel(r'C:\Users\Ziyin\Desktop\Rainfall_data.xlsx')#导入excel

数学统计

df.describe()#描述性统计
df["Specific Humidity"].mean()#值的平均数
df["Specific Humidity"].unique()#值的类型
df["Specific Humidity"].value_counts()#值出现多少次
df.cov()#协方差矩阵
df.corr()#相关系数矩阵
df["Relative Humidity"].corr(df["Specific Humidity"])#两个列的相关系数

查询

df.loc[(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#条件查询


df.loc[lambda df:(df["Precipitation"]<100)&(df["Relative Humidity"]>50)&(df["Temperature"]>20)]#lambda函数多条件查询

新建列

df["hh哈"]=df["Relative Humidity"]-df["Specific Humidity"]#直接赋值新列
Temperature_type = lambda Temperature: '高温' if Temperature > 33 else ('低温' if Temperature < 10 else '常温')#lambda函数赋值
df['Temperature_type'] = df.apply(lambda row: Temperature_type(row['Temperature']), axis=1)#apply方法赋值列
df['Temperature_type'].value_counts()#计数

df['siducha']=''#新建列的一种方法
df.loc[df["Relative Humidity"]-df["Specific Humidity"]>10,"disucha"]="温差大"#按条件进行分组分别赋值
df.loc[df["Relative Humidity"]-df["Specific Humidity"]<10,"disucha"]="温差小"
df['disucha'].value_counts()#计数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值