练习1
读取 catNames2.csv 文件,完成需求如下:
- 找到所有的使用次数超过800的猫的名字
import pandas as pd
# 读取文件数据
catNames = pd.read_csv("catNames2.csv")
catNames = catNames[catNames["Count_AnimalName"]>800]
- 获取用次数最高的名字
catNameIDMax = catNames["Count_AnimalName"].idxmax()
catBestName = catNames["Row_Labels"][catNameIDMax]
输出结果:
'BELLA'
练习2
- 读取 五粮液2020.xlsx 数据,指定 索引为0列 为 行索引
wly_data = pd.read_excel("五粮液2020.xlsx",index_col=0)
- 查看 该数据的基本信息
wly_data.info()
- 计算每一天各指标的差异值
wly_data.diff()
- 计算其 pre_close 的增长率
- 将 pre_close 的增长率添加至 wly_data 数据中
# 计算其 pre_close 的增长率
wly_pct_change = wly_data["pre_close"].pct_change()
# 将 pre_close 的增长率添加至 wly_data 数据中
wly_data["pct_change"] = wly_pct_change
- 将 pct_change 该列 呈现的 NaN 用0填充
wly_data.fillna(value=0,inplace=True)
- 查看 pre_close 与 pct_change 的相关性
wly_data["pre_close"].corr(wly_data["pct_change"])
输出结果:
-0.02569885399397468
- 将 pct_change 这列乘以100 保留两位小数 成为百分比
func = lambda x:"%.2f%%"%(x*100)
wly_data["pct_change"] = wly_data["pct_change"].apply(func)