有了Python的基本功之后,我们得考虑如何实践?由于是银行从业者,自然会考虑从投资的角度出发,以前更多是用EXCEL表从WIND导出数据,这一次计划从天天基金网爬数开始。
感谢如下作者的文章:https://www.jianshu.com/p/1d67cfbfd9bb
一、如何构建投资模型?
马科维茨的投资组合理论让大家理解了收益与风险的数学表达,通过适当的组合可以在一定收益的范围内降低风险。但数学表达依赖于指标量化,所以还是得考虑如何量化方可构建投资模型,大致的思路可以按照如下流程:
- 获取公开数据:最大化获取金融产品的数据(历史数据、所有可查询的公开数据)
- 构建数据模型:在已有条件下搭建数据模型
- 构建评分体系:融入专业知识,构建评分体系
二、获取数据
天天基金网的基金数据应该算比较全面了,我们得充分利用Python爬数的功能。这里必须要用到浏览器的开发者功能。
比如基金的基础信息会用到如下JS文件:
http://fund.eastmoney.com/pingzhongdata/005911.js?v=20200207145643a