1:题目
题目要求
- 读取 五粮液2020.xlsx 数据
- 查看该数据的基本信息
- 计算每一天各指标的差异值
- 计算其 pre_close 的增长率
- 将 pre_close 的增长率添加至数据中(新增列)
- 将 pct_change 该列 呈现的 NaN 用0填充
- 查看 pre_close 与 pct_change 的相关性
- 将 pct_change 这列乘以100 保留两位小数 成为百分比
2:答案
第一题
代码
import numpy as np
import pandas as pd
a1 = pd.read_excel('五粮液2020.xlsx', mode='r', encode='utf-8')
a1
执行效果
第二题
代码
# 查看列的基本信息
a2 = a1.info()
# 查看汇总统计信息
a1.describe()
执行效果
第三题
代码
a1.loc[:, 'open': 'pre_close'].diff()
执行效果
第四题
代码
a2 = a1['pre_close'].pct_change()
a2
执行效果
第五题
- 将 pre_close 的增长率添加至数据中(新增列)
代码
a1['pct_change'] = a2
a1
执行效果
第六题
- 6:将 pct_change 该列 呈现的 NaN 用0填充
代码
a1['pct_change'].fillna(0, inplace=True)
a1
执行效果
第七题
- 7:查看 pre_close 与 pct_change 的相关性
代码
a1[['pre_close', 'pct_change']].corr()
执行效果
第八题
- 8:将 pct_change 这列乘以100 保留两位小数 成为百分比
代码
a1['pct_change'] = a1['pct_change'].apply(lambda x: '%.2f%%'%(x*100 ))
a1
执行效果