暑期实训个人工作记录2021.7.6

股票相似度分类

参考文章:可视化股票市场结构||沪深300股票聚类可视化

数据来源:Tushare大数据社区

协方差分类

  股票选取了上证50中的35支股票,股票代码如下:

‘600036sh’, ‘600031sh’, ‘601166sh’, ‘600104sh’, ‘600030sh’, ‘601628sh’, ‘601766sh’, ‘601857sh’, ‘601398sh’, ‘601390sh’, ‘600029sh’, ‘600028sh’, ‘601111sh’, ‘600837sh’, ‘600887sh’, ‘600690sh’, ‘600519sh’, ‘600016sh’, ‘601988sh’, ‘601601sh’, ‘600019sh’, ‘601186sh’, ‘600703sh’, ‘600196sh’, ‘601318sh’, ‘600050sh’, ‘600309sh’, ‘600048sh’, ‘600276sh’, ‘601088sh’, ‘600585sh’, ‘600000sh’, ‘601328sh’, ‘601939sh’, ‘600340sh’
在这里插入图片描述

  在scikit-learin众多可用的聚类技术中,我们采用Affinity Propagation(近邻传播);因为它不强求相同大小的类,并且能从数据中自动确定类的数目。

  收盘价-开盘价,作为信息载体。通过调整样本选取的时间,来观察一段时间内各股票的相似性

# 收盘价-开盘价,作为信息载体
variation = close_prices - open_prices   
for symbol in symbols:
    print('Fetching quote history for %r' % symbol, file=sys.stderr)
    url = ('D:/那四年/项目实训/暑期实训/git/sz50/{}.csv')
    #nrows为时间片段,一行为一天,从最新一天开始往前算
    quotes.append(pd.read_csv(url.format(symbol),nrows=500))

  针对不同的时间片段,股票的聚类情况都会发生变化。

  时间选取过去500天:
过去500天聚类情况
过去500天聚类可视化

  时间选取过去100天:
过去100天聚类情况
过去100天聚类可视化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值