探索百度指数与股价的关系
前言
百度指数代表着某个词在互联网的热度,心血来潮,想探索一下百度指数与相关企业股价之间是否有关系。本文选取四家车企,分别为CC汽车,BYD,SQ,CA汽车。(股价数据来源tushare,id:434709)
一、百度指数爬虫
网站:https://index.baidu.com/v2/index.html#/
爬虫的话需要登陆以后,获取COOKIES,在这里就不赘述了,有疑问的同学可以私信沟通。
二、tushare获取股价数据
因为百度的限制,拉长时间后只能选取以周为单位的数据,因此我们股价的数据也获取每周的。
代码如下(示例):
pro = ts.pro_api()
pro.weekly(ts_code='601633.sh', start_date='20180101', end_date='20210411', fields='ts_code,trade_date,close')
因为tushare不能同时获取多只股票的多时间数据,因此只能四只分别获取后进行拼接。
接下来就是要把百度指数和股价按照时间进行一一匹配。
代码如下(示例):
data = pd.merge(paper,df ,left_on='date',right_on='trade_date' ,how='outer') #连接数据
有了这个表我们就可以进行可视化、以及按条件进行收益计算了。
三、收益计算
先对数据进行标准化处理
代码如下(示例):
def stand(factor):
mean = factor.mean()
std = factor.std