ok,和往常几篇文章一样,本文分为三部分:
-
① 4 种基金的大致介绍
-
② 爬取基金收益数据及TOP300收益的基金最新持仓
-
③ 从6个维度进行基金数据分析
鉴于本篇文章的整体基调是围绕基金所做的分析,所以对于基金是什么有必要做一个简单的介绍。
当然,也只是止步于简单的介绍。本篇更多的是在对近几年发行的基金收益、持仓等数据进行爬取,做一个简单的分析
目前各基金公司披露的持仓数据都是截止 2021年第三季度,后续也会披露最新持仓数据,到时候 小一会继续跟踪分析,记得到时候回来看更新!
ok,直接开始,go
1.1 基金介绍
只想看分析的同学可以 直接滑到第三小节
只想看结论的同学可以 直接滑到文末
先来说说基金是什么?
首先,对于基金,大致可以分为:货币型基金、债券型基金、混合型基金、股票型基金等等
主要说一下这几个各自是什么,后面我们针对性的用数据去分析。
货币型基金
只投资于货币市场,例如像银行存款,国家或者企业发行的短期债券等,因为波动性较小、风险较低,所以可以等同于储蓄产品一样。
类似的像余额宝就是货币型基金,评价这种货币型基金主要看:七日年化收益率和万份收益。
这个比较容易理解,风险也很低,个人要选择货币型基金就直接余额宝完事,T+0,简简单单。
债券型基金
相比货币型基金,债券型基金投资的债券期限比较长,除了债券,也可以投资股票。
债券基金相对于货币基金有一定的风险,但从长期来看,收益也会更高点。
混合型基金
相比债券型基金,混合型基金除了债券,还可以投资不同风格的股票。
混合型基金根据股票和债券的占比,又细分为 偏股型基金 和配置型基金等等。
相比前两者,混合型基金实现投资的多元化,无需去分别购买风格不同的股票型基金、债券型基金和货币基金。
股票型基金
股票型基金是指投资于股票市场的基金,其中股票仓位不能低于80%。
股票型基金可以细分为主动型和被动型(指数型基金)等,相比主动型,指数型会更稳健些,紧跟大盘指数波动
相比前三者,股票基金属于 高风险高收益类 的基金。
下面来看今天的核心:爬虫+分析
2. 基金数据爬取
爬虫部分的核心代码比较简单,比起上次的租房数据爬取简单了x倍,今天主要 说一下流程就行。
想学习爬虫的同学回头去看租房数据:爬虫实战—拿下最全租房数据 | 附源码
基金数据的爬取小一选择了天天基金网,首页长这样的:
可以看到,对于基金类型:股票、混合、债券和指数都分的一清二楚,采集字段的时候将每个基金所有的收益率情况请拿下来。
ok,那就直接用官网定的标签去爬,采集上图圈出的数据字段。
第二步就是每个基金的详细持仓情况,看图:
主要包括基金的成立时间、规模、基金经理以及每个季度的详细持仓情况。
爬虫大致思路
-
爬取每个基金标签下的所有基金以及收益率情况
-
根据基金代码爬取每个基金得到详细指标
-
根据基金代码爬取每个基金的季度持仓情况
需要说明一下,第 2 步和第 3 步的数据不在一个页面下,第 2 步的数据通过页面解析可以拿到,第 3 步的数据是动态加载后呈现在页面上的,可以通过接口拿到数据。
限于篇幅,主要代码如下:
# 爬取每个基金的数据
rank_detail_data = []
position_data = []
error_funds_list = []
for row_index, data_row in data_rank.iterrows():
fund_code = str(data_row[‘基金代码’])
try:
‘’‘爬取页面,获得该基金的详细数据’‘’
position_title_url = “http://fundf10.eastmoney.com/ccmx_” + str(fund_code[1:]) + “.html”
print(‘正在爬取第 {0}/{1} 个基金 {2} 的详细数据中…’.format(row_index+1, len(data_rank), fund_code[1:]))
response_title = requests.get(url=position_title_url, headers={‘User-Agent’: get_ua()}, timeout=10)
# 解析基金的详细数据
rank_detail_info = resolve_rank_detail_info(fund_code[1:], response_title)
“”“爬取页面,获取该基金的持仓数据”“”
position_data_url = “http://fundf10.eastmoney.com/FundArchivesDatas.aspx?type=jjcc&code=” + \
str(fund_code[1:]) + “&topline=10&year=&month=&rt=” + str(random.uniform(0, 1))
print(‘正在爬取第 {0}/{1} 个基金 {2} 的持仓情况中…’.format(row_index + 1, len(data_rank), fund_code[1:]))
# 解析基金的持仓情况
response_data = requests.get(url=position_data_url, headers={‘User-Agent’: get_ua()}, timeout=10)
fund_positions_data = resolve_position_info(fund_code[1:], response_data.text)
# 保存数据
rank_detail_data.append(rank_detail_info)
position_data.extend(fund_position_data for fund_position_data in fund_positions_data)
except:
error_funds_list.append(fund_code)
print(“{0} 数据爬取失败,稍后会进行重试,请注意!”.format(str(fund_code[1:])))
# 随机休眠2-4 秒
time.sleep(random.randint(2, 4))
爬取完成后,数据是这样的:
3. 基金数据分析
对于4种类型的基金数据,下面主要对 股票型基金进行分析
首先,股票型基金共 1417 个,后面分析和排序的依据均是针对 今年来收益率 这个指标进行的,大家注意下
1. 基本:收益率分布
1417个股票型基金中 1410 个今年来收益率不为空,针对其进行分析:
股票型基金今年来收益率>0 的有 840 个,占比 59.57%;整体今年来平均收益率为 5.89%
如下图:
再来看下整体的收益率分布情况:
股票型基金的收益率小于0的占比40%,而且随着收益率的上升基金个数逐渐下降,和上上季度正态分布的图像形成了鲜明的对比
另外,收益率大于50%只有13只基金,真的是凤毛麟角般的存在
2. 基本:资产规模分布
对于资产规模,小一是这样理解的:大资产的基金在收益稳定的同时也会出现船大难掉头的情况,小规模的资金收益波动会较大,但也可以及时规避风险。
因为基金较多,以下只选取今年来收益率 Top300 的基金分析其资产规模。另外,资产规模均是截止到 2021-09-30 日的资金资产规模。
一起看图:
股票型基金的资产规模集中在 0-10亿元 区间,其中,大于70亿元 的基金有 10个,占比为 3.33%
可以看到,在20 亿元以下规模的基金占比 80以上,相比上上季度的78%上升了2PP
3. 重点:收益率前10!
基本面看完了,下面来点干货:
股票型基金今年来收益率的最高是 113.98%,Top10 的平均收益是 62.98%
可以看到,前10收益率的基金差距比较明显,尤其是基金『前海开源公用事业股票』收益率一骑绝尘,拉开第二名51.2个百分点,大牛中的大牛
除了第一名之外,其他2-10的基金收益率比较平稳,特别是2-5名之间,差距较小。
从图中看,资产规模与近两年的收益率不是强相关,另外,排名前5 的基金似乎是个不错的选择
供参考:
4. 干货:基金经理选谁?
买基金要看对基金经理,所以这一步是分析基金经理
同样的,我们取收益率较高的 前50名基金进行分析,根据基金经理 持有基金的平均收益率 为标准,选取排名 前15 的经理,如下图:
平均收益率前5的股票型基金经理都是各持有一只股票型基金,而对应的股票型基金我们在上一步已经看到了
可以看到,这次的结果和上上季度的分析结果完全不一样,特别是在头部基金经理这块,基本是重新洗牌了
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
[外链图片转存中…(img-6XidVvjD-1713545543460)]
[外链图片转存中…(img-3LlxaHLP-1713545543461)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)