基于机器学习的金融资产定价

一般的资产定价模型属于广义资产定价,包括风险-收益比模型与直接预测资产价格模型。资产定价数据包括结构化数据与非结构化数据,数据的质量决定了模型性能的上限。

结构化数据包括股票交易数据、期货交易数据、外汇交易数据、宏观数据等,以及衍生出的市场因子、规模、价值、动量、盈利、换手率等。非结构化数据包括社交媒体数据,以及上市公司季报内容、年报内容、金融中介分析报告、金融图片、企业知识图谱数据等。

结构化数据与非结构化数据并非完全对立,而是存在交叉的情况。根据对数据类型的处理方式,将机器学习模型分成两类:

1)基于特征处理的机器学习方法,包括主成分分析、奇异值分解、独立成分分析、贝叶斯算法、马尔可夫算法、自动编码机、支持向量机、决策树算法、随机森林、粒子群算法、遗传算法、迁移算法和集成学习算法等;

2)端到端处理深度学习方法,包括CNN、LSTM、强化学习、文本分析、知识图谱和模型融合等。

想创新的的话,可以参考如下方向:

(1)拓展性。

相比传统的分析研究方法,近年来在图像、 声音和自然语言处理方面取得显著进展的CNN和LSTM等算法在资产定价方面使用得较少,这可能是这些深度学习模型本身的复杂性导致抽取了过多的深层次特征,这些深层次特征所具有的弱性因子暴露特性与研究发掘金融市场本质规律不一致,未来可进行进一步的研究。

(2)数据有限性。

随着短样本和非结构化数据的增加,金融数据时间跨度相对较短。例如,社交媒体数据最多只有十余年的数据可供使用;比较完备的美国股市数据,即使从1970年算起,大概也只有600个月度数据。这些数据对于机器学习的大规模训练的作用十分有限,会影响模型的准确性;而非传统另类数据的作用则越来越明显,迁移算法就是一种可能性方案。现有的许多机器学习模型没有考虑现实交易的限定因素,如资产流动性、交易成本、交易摩擦和法律限制等,如何将研究成果应用到具体的商业环境中,以辅助或替代人力,是未来的重要研究方向。

(3)可解释性。

机器学习方法面临准确率和模型复杂度之间的权衡,模型越复杂,金融规律解释难度越高。线性回归可解释性强,但无法处理复杂的数据关系,而深度神经网络可以处理变量之间的深层关系,但模型容易成为黑箱,只能使用准确率等来替代传统资产定价模型评估标准。投资者希望对投资逻辑有清晰的解释,以处理不断变化的市场状况。考虑加强事实认知推理的解释作用,采用知识计算方法,将全流程资产定价问题转换为多重函数组合而成的知识图谱计算问题,使得推理路径和推理逻辑可以为人类所掌握,这是提高资产定价模型效果的重要研究方向。

(4)跨学科融合性。

对于衍生品类资产定价,如果采用传统的金融模型,由于生成模型经过多层嵌套,容易导致传统模型过于复杂,反而不易刻画变量与资产价格之间的关系;使用机器学习则可以较为轻松地拟合,但同时增加了理解金融规律的难度。因此需要更多地从交易市场自身规律与交易者的博弈出发,行为金融和机器学习技术相结合的混合方法可能会被证明更有效。

(5)泛化性。

机器学习资产定价需要解决如何有效地从数据中提取出需要的特征并形成样本外拟合能力(即模型的泛化能力)的问题,但市场动态性强,同一股票概率分布前后并不一致。此外,随着资讯越来越便捷,迅速处理交易者博弈,更快纠正价格,对金融领域的模型自适应能力有更高的要求。

mbd.pub/o/GeBENHAGEN

擅长现代信号处理(改进小波分析系列,改进变分模态分解,改进经验小波变换,改进辛几何模态分解等等),改进机器学习,改进深度学习,机械故障诊断,改进时间序列分析(金融信号,心电信号,振动信号等)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值