程序源代码
import pandas as pd
data = {"wendu":["5度","15度","10度","-4度","25度"],
"high_tem":["20度","24度","30度","32度","35度"],
"low_tem":["5度","-5度","2度","6度","18度"]}
# 定义DataFrame框架
df=pd.DataFrame(data,index=["一月","二月","三月","四月","五月"])
# 字符转数字df[参数1,参数2]
# 参数1::代表所有行
# 参数2:"wendu" 代表df数据列wendu
df.loc[:,"wendu"] = df["wendu"].str.replace("度","").astype("int32")
"""
把符合条件的数据建立到一个新列中
1、建立一个空列 df["new_data"]=""
2、df.loc[条件列,新列字符串名称] = "新值",
条件列是定义筛选条件,
新列字符串名称:是定义位置
等号右边的值:是定义结果
"""
df["new_data"] = ""
df.loc[df["wendu"]>10,"new_data"]="大于10"
df.loc[df["wendu"]<10,"new_data"]="小于10"
df.loc[df["wendu"]==10,"new_data"]="等于10"
# value_counts结构统计方法
print(df["new_data"].value_counts())
最后输出结果
wendu high_tem low_tem new_data
一月 5 20度 5度 小于10
二月 15 24度 -5度 大于10
三月 10 30度 2度 等于10
四月 -4 32度 6度 小于10
五月 25 35度 18度 大于10