机器学习预测股票收益(三)之比较随机森林、支持向量机回归模型以及神经网络多层感知器模型


前言

本文将使用Python整理1927-2020年所有美国上市公司股票数据。根据历史收益以及交易量,使用随机森林,支持向量机以及神经网络等机器学习方法预测股票收益,并比较模型结果。数据处理以及函数见“机器学习预测股票收益(一)”

一、随机森林模型

result_rfr =  pd.DataFrame()
rfr = RandomForestRegressor(random_state = 44,max_depth = 70,max_features = 'sqrt',min_samples_leaf = 4,min_samples_split=2,n_estimators=200)

model1 = rfr.fit(X_train, y_train)

y_pre_rfr = rfr.predict(X_test)
y_pre_rfr = pd.Series(y_pre_rfr,name = "pre",index = y_test.index)

pre_data_rfr =  pd.concat([permno_test,y_test, y_pre_rfr], axis=1)
result_rfr =  result_rfr.append(pre_data_rfr)

mse_rfr = metrics.mean_squared_error(y_test, y_pre_rfr)
print("MSE_rfr: %.4f" % mse_rfr)

mae_rfr = metrics.mean_absolute_error(y_test, y_pre_rfr)
print("MAE_rfr: %.4f" % mae_rfr)

R2_rfr = metrics.r2_score(y_test,y_pre_rfr)
print("R2_rfr: %.4f" % R2_rfr)  

在这里插入图片描述

lgvalue_rfr.plot()
plt.ylabel("log($ value of investment)")
plt.legend(["risk-free,end value=$9.10", "market,end value=$187.81",
            "long,end value=$1,883.87", "short,end value=$26.66", "long-short,end value=$109.27"])

在这里插入图片描述

pf_xret_rfr = pf_rfr - pfactors.loc[:,"RF"]
pf_xret_rfr = pf_xret_rfr.rename("pf excess return_rfr")
analyze_performance(pf_xret_rfr)

在这里插入图片描述

regression_results(pf_xret_rfr,pfactors)

在这里插入图片描述

二、SVR模型

result_svr=  pd.DataFrame()
f_importance_svr =  pd.DataFrame()
perform_svr =  pd.DataFrame()

svr = SVR( kernel='linear',C=1.0)
model2 = svr.fit(X_train, y_train)


y_pre_svr = svr.predict(X_test)
y_pre_svr = pd.Series(y_pre_svr,name = "pre",index = y_test.index)
    
pre_data_svr =  pd.concat([permno_test,y_test, y_pre_svr], axis=1)
result_svr =  result_svr.append(pre_data_svr)

mse_svr = metrics.mean_squared_error(y_test, y_pre_svr)
print("MSE_svr: %.4f" % mse_svr)

mae_svr = metrics.mean_absolute_error(y_test, y_pre_svr)
print("MAE_svr: %.4f" % mae_svr)

R2_svr = metrics.r2_score(y_test,y_pre_svr)
print("R2_svr: %.4f" % R2_svr)  

在这里插入图片描述

lgvalue_svr.plot()
plt.ylabel("log($ value of investment)")
plt.legend(["risk-free,end value=$9.10", "market,end value=$187.81",
            "long,end value=$2,886.89", "short,end value=$40.75", "long-short,end value=$50.20"])

在这里插入图片描述

pf_xret_svr = pf_svr - pfactors.loc[:,"RF"]
pf_xret_svr = pf_xret_svr.rename("pf excess return_svr")
analyze_performance(pf_xret_svr)

在这里插入图片描述

regression_results(pf_xret_svr,pfactors)

在这里插入图片描述

三、MLPRegressor模型

result_mlp=  pd.DataFrame()
perform_mlp =  pd.DataFrame()
   

mlp = MLPRegressor(hidden_layer_sizes = (256,128),activation = "relu",solver='adam')
model3 = mlp.fit(X_train, y_train)

y_pre_mlp = mlp.predict(X_test)
y_pre_mlp = pd.Series(y_pre_mlp,name = "pre",index = y_test.index)
    
pre_data_mlp =  pd.concat([permno_test,y_test, y_pre_mlp], axis=1)
result_mlp =  result_mlp.append(pre_data_mlp)
    
mse_mlp = metrics.mean_squared_error(y_test, y_pre_mlp)
print("MSE_mlp: %.4f" % mse_mlp)

mae_mlp = metrics.mean_absolute_error(y_test, y_pre_mlp)
print("MAE_mlp: %.4f" % mae_mlp)

R2_mlp = metrics.r2_score(y_test,y_pre_mlp)
print("R2_mlp: %.4f" % R2_mlp)

在这里插入图片描述

lgvalue_mlp.plot()
plt.ylabel("log($ value of investment)")
plt.legend(["risk-free,end value=$9.10", "market,end value=$187.81",
            "long,end value=$1,687.88", "short,end value=$23.34", "long-short,end value=$89.75"])

在这里插入图片描述

pf_xret_mlp = pf_mlp - pfactors.loc[:,"RF"]
pf_xret_mlp = pf_xret_mlp.rename("pf excess return_mlp")
analyze_performance(pf_xret_mlp)

在这里插入图片描述

regression_results(pf_xret_mlp,pfactors)

在这里插入图片描述

总结

在这里插入图片描述
在这里插入图片描述

比较 3 个模型的结果,发现基于随机森林回归的策略的平均回报最高,而 SVR 的平均回报最低。 随机森林回归的结果是 3 个模型中最不稳定的。 MLP 回归器在 3 个模型中的sharp ratio 最高。 但是,本文只对随机森林回归模型的调节了最佳参数,MLP回归和SVR模型的参数参考了其他文献,如果找到了它们的最佳参数,这两个模型可能会表现得更好。

  • 1
    点赞
  • 54
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
随机森林回归和BP神经网络是两种常用的机器学习算法。它们在回归问题上有不同的优势和特点。 首先,随机森林回归是一种集成学习方法,它通过组合多个决策树来进行预测。每个决策树都是基于随机选择的子样本和特征集来构建的,因此能够有效减少过拟合问题。随机森林回归还可以处理多个输入特征和非线性关系,具有很好的鲁棒性,并且不需要对数据进行太多的预处理或归一化。 相比之下,BP神经网络是一种基于反向传播算法的人工神经网络模型,它可以学习输入和输出之间的复杂映射关系。BP神经网络可以处理非线性和非参数的问题,并且在训练过程中可以自动调整权重和偏差参数。然而,BP神经网络容易过拟合,需要较多的数据和计算资源,并且对数据的预处理要求较高。 总体而言,随机森林回归相对于BP神经网络具有以下优势:1)随机森林回归更容易使用和调整参数,而BP神经网络需要更多的设计和调整;2)随机森林回归对异常数据和噪声具有较好的鲁棒性;3)随机森林回归可以处理高维数据和非线性关系,而BP神经网络对数据维度和特征关系的要求较高。 但是,在某些情况下,BP神经网络可能比随机森林回归更适合,尤其是在需要进行时序预测、复杂模式识别或非线性优化等问题中。综上所述,选择随机森林回归还是BP神经网络应根据具体问题的特点和需求来决定。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值