本工具的主要目地是,利用python抓取晨星网、天天基金网上的数据,进行组合重仓股分析、组合后行业持仓分析、基金具体参数信息分析。
一、晨星的坑
晨星网也有组合透视功能,但是存在三项一足
1、只能分析组合内的前十重仓股。实际应用中,前十远远不行,通过前十无法具体判断组合内的行业偏重、个股集中度,会引起投资偏差;
2、组合内的行业分布太过粗略。像制造业、批发零售等,不具备可参考信息;
3、当组合内含有QDII基金、港股基金时,前十重仓股的计算会出错。我选过几个组合,通过晨星透视计算前十重仓,再用计算器自己计算前十重仓,存在部分偏差。
以上的坑自己踩过,后来想法,不如自己做一个适合自己的工具,方便分析。
二、工具的主要功能
1 分析10N重仓股(N为组合内基金个数)。假设组合内有6只基金,每只基金都公布了前十重仓股,共有60只重仓股(实际上会有不少重复持仓,这也是组合分析的原因之一,避免个股集中度过高及板块集中度过高)。该工具会对该60只个股的持仓进行计算。
2 从板块的角度对基金进行分类。如上假设,共有60只重仓股,每只重仓股都有一级行业和二级行业分类,对这60只重仓股的一二级行业进行分类统计,计算出组合内的板块持仓情况,避免集中投资于某个周期轮动板块。不然周期下行,还不知道怎么亏的。
3 抓取晨星网上的具体信息,如3月内最大回撤、标准差、风险系数、夏普比、阿尔法、贝塔、R平方;抓取天天基金网上的具体信息,如规模、股票集中度、债券集中度、成立日期等。 这些信息对基金分析有一定帮助。
三、大概逻辑
抓取天天基金网信息:首先抓取网页保存为本地html文件,后期如有需要解析该html文件;
抓取晨星网数据:利用selinum+webdriver技术进行抓取
以代码的形式呈现,具体参见https://github.com/MrDujing/FundCombination。里面有关于代码的详细表述
四、注意事项
1 我没有做代理池,因为是用于个人投资分析,抓取频率低,且组合内基金个数少,没必要去做;
2 组合分析角度上:当数据抓取后,如何分析看个人,也可以根据自己需要写代码分析其他参数;
3 基金信息获取上:不管是天天网还是晨星网,能抓取其中一些信息,就能抓取另外一些。代码已有,可根据个人需求抓取。
4 基金盈利:本质是为了赚钱,祝各位韭基同僚开心