题目要求:
下载这两个数据文件,数据分别为某两股票为期一年的日交易信息,请根据每只股票的收盘价与开盘价计算每天的股票价格的收开盘的差值,计算一年来那只股票的这种差值的波动大?此差值的分布是否服从正态分布,分布是否是对称的?
实验结果:
代码实现:
导入包:
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
导入文件:
df1 = pd.read_excel("daily_20240428200125.xlsx")
df2 = pd.read_excel("daily_20240428200156.xlsx")
计算波动情况:
volatility_df1 = df1['收开盘差值'].std()
volatility_df2 = df2['收开盘差值'].std()
判断是否为正态分布:
w, p = stats.shapiro(data)
if p > 0.05:
print(f"{title}的分布很可能是正态分布")
else:
print(f"{title}的分布很可能不是正态分布")
完整代码:
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
df1 = pd.read_excel("daily_20240428200125.xlsx")
df2 = pd.read_excel("daily_20240428200156.xlsx")
df1['收开盘差值'] = df1['收盘价'] - df1['开盘价']
df2['收开盘差值'] = df2['收盘价'] - df2['开盘价']
volatility_df1 = df1['收开盘差值'].std()
volatility_df2 = df2['收开盘差值'].std()
print(f"股票1的波动情况为: {volatility_df1}")
print(f"股票2的波动情况为: {volatility_df2}")
more_volatile = "股票1" if volatility_df1 > volatility_df2 else "股票2"
print(f"{more_volatile}每天的波动更大")
def check_distribution(data, title):
w, p = stats.shapiro(data)
if p > 0.05:
print(f"{title}的分布很可能是正态分布")
else:
print(f"{title}的分布很可能不是正态分布")
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False #解决图片显示中文乱码的问题,如果图片解释文字使用英文可以不写
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.hist(data, bins=30, density=True, alpha=0.6, color='g') #绘制直方图
plt.title(f'{title} 价格差异的直方图')
plt.xlabel('价格差异')
plt.ylabel('频率')
plt.subplot(1, 2, 2)
stats.probplot(data, plot=plt) #绘制QQ图
plt.title(f'{title}价格差异的QQ图')
plt.xlabel('理论分位数')
plt.ylabel('要求值')
plt.show()
check_distribution(df1['收开盘差值'], '股票1')
check_distribution(df2['收开盘差值'], '股票2')