说明:本文选取平安银行(000001.SZ)、万科A(000002.SZ)、白云机场(600004.SH)和东风汽车(600006.SH)四只股票构建投资组合,全部数据来自于Tushare社区。
获取及整理数据
1.导入获取及处理数据所需要的基本函数包
import numpy as np
import pandas as pd
import tushare as ts
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 处理负号显示问题
2.设置自己的Token,调用Tushare API实例化
your_token = '*******************************************************'
pro = ts.pro_api(your_token)
3.调用API获取四只股票的前复权收盘价数据
stock_code_list = ['000001.SZ', '000002.SZ', '600004.SH', '600006.SH']
prices = pd.DataFrame() # 创建一个空的DataFrame,用于存放股票价格数据
for stock_code in stock_code_list:
if 'trade_date' not in prices.columns:
prices['trade_date'] = ts.pro_bar(ts_code=stock_code, api=pro, adj='qfq', start_date='20140101')['trade_date']
prices[stock_code] = ts.pro_bar(ts_code=stock_code, api=pro, adj='qfq', start_date='20140101')['close']
这里只拿2014年以来的数据研究,查看一下拿到的数据。
4.数据清洗,重新按交易日期排序
prices.dropna(inplace=True) # 数据清洗
prices.set_index('trade_date', inplace=True) # 设置索引
prices.sort_index(ascending=True, inplace=True) # 重新排序
这样我们拿到了整理好的数据:
个股收益分布
1.先看一下这四只个股的收益情况
(prices/prices.iloc[0]).plot(figsize=(15, 8), grid='on')
不难发现,这四只股票的波动程度蛮大的,接下来看一下收益分布直方图。
# 资产个数
asset_nums = prices.shape[1]
asset_nums # 输出:4,一共有四只股票
# 收益分布直方图
returns = np.log(prices/prices.shift(1))
returns.hist(bins=40, figsize=(15, 8))
蒙特卡洛模拟组合的期望收益和标准差
1.生成随机权重,并标准化权重
# 生成随机权重
weights = np.random.random(asset_nums)
print(weights) # 查看随机权重
weights /= np