实验题目
利用实验2完成的情绪标注文本,逐日构建情绪指数;分析该指数和证券市场指数之间的统计相关性;尝试进行市场预测。
使用python, 数据库及统计软件:
(1)设定统计期为:2014年10月至2015年10月;
(2)逐日构建市场情绪指数;
(3)使用统计软件,分析情绪指数和沪深300(SH:000300)指数之间的相关性;
(4)探讨情绪指数和沪深300之间的时间相关性(指标之间是否存在提前或者滞后)。
实验代码
1. 引入库
import tushare as ts
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import numpy as np
from sklearn import preprocessing
2. 使用ts.get_k_data载入股指数据
sh = ts.get_k_data('sh', start="2014-01-01",end="2015-10-21", autype='qfq') # 获取上证数据
sh["p_change"] = (sh["close"] / sh["close"].shift(1) - 1) * 100 # 利用今日收盘价和前日收盘价计算股价波动,新增一列
sh
把获取的数据和实验二中的score整合到一起,此处我犯了一个错误,直接把两个表使用merge()方法合并到一起,后来数据不对才发现有问题:因为股市周末不开盘,所以股票指数日期并不是连续的,但情绪指数数据却是每天都有ÿ