基于python进行信息爬取,进行基金组合透视分析

本工具的主要目地是,利用python抓取晨星网、天天基金网上的数据,进行组合重仓股分析、组合后行业持仓分析、基金具体参数信息分析。

一、晨星的坑

晨星网也有组合透视功能,但是存在三项一足

1、只能分析组合内的前十重仓股。实际应用中,前十远远不行,通过前十无法具体判断组合内的行业偏重、个股集中度,会引起投资偏差;

2、组合内的行业分布太过粗略。像制造业、批发零售等,不具备可参考信息;

3、当组合内含有QDII基金、港股基金时,前十重仓股的计算会出错。我选过几个组合,通过晨星透视计算前十重仓,再用计算器自己计算前十重仓,存在部分偏差。

以上的坑自己踩过,后来想法,不如自己做一个适合自己的工具,方便分析。

二、工具的主要功能

1 分析10N重仓股(N为组合内基金个数)。假设组合内有6只基金,每只基金都公布了前十重仓股,共有60只重仓股(实际上会有不少重复持仓,这也是组合分析的原因之一,避免个股集中度过高及板块集中度过高)。该工具会对该60只个股的持仓进行计算。

2 从板块的角度对基金进行分类。如上假设,共有60只重仓股,每只重仓股都有一级行业和二级行业分类,对这60只重仓股的一二级行业进行分类统计,计算出组合内的板块持仓情况,避免集中投资于某个周期轮动板块。不然周期下行,还不知道怎么亏的。

3 抓取晨星网上的具体信息,如3月内最大回撤、标准差、风险系数、夏普比、阿尔法、贝塔、R平方;抓取天天基金网上的具体信息,如规模、股票集中度、债券集中度、成立日期等。 这些信息对基金分析有一定帮助。

三、大概逻辑

抓取天天基金网信息:首先抓取网页保存为本地html文件,后期如有需要解析该html文件;

抓取晨星网数据:利用selinum+webdriver技术进行抓取

以代码的形式呈现,具体参见https://github.com/MrDujing/FundCombination。里面有关于代码的详细表述

四、注意事项

1 我没有做代理池,因为是用于个人投资分析,抓取频率低,且组合内基金个数少,没必要去做;

2 组合分析角度上:当数据抓取后,如何分析看个人,也可以根据自己需要写代码分析其他参数;

3 基金信息获取上:不管是天天网还是晨星网,能抓取其中一些信息,就能抓取另外一些。代码已有,可根据个人需求抓取。

4 基金盈利:本质是为了赚钱,祝各位韭基同僚开心

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值