混合型基金
相比债券型基金,混合型基金除了债券,还可以投资不同风格的股票。
混合型基金根据股票和债券的占比,又细分为 偏股型基金 和配置型基金等等。
相比前两者,混合型基金实现投资的多元化,无需去分别购买风格不同的股票型基金、债券型基金和货币基金。
股票型基金
股票型基金是指投资于股票市场的基金,其中股票仓位不能低于80%。
股票型基金可以细分为主动型和被动型(指数型基金)等,相比主动型,指数型会更稳健些,紧跟大盘指数波动
相比前三者,股票基金属于 高风险高收益类 的基金。
下面来看今天的核心:爬虫+分析
2. 基金数据爬取
爬虫部分的核心代码比较简单,比起上次的租房数据爬取简单了x倍,今天主要 说一下流程就行。
想学习爬虫的同学回头去看租房数据:爬虫实战—拿下最全租房数据 | 附源码
基金数据的爬取小一选择了天天基金网,首页长这样的:
可以看到,对于基金类型:股票、混合、债券和指数都分的一清二楚,采集字段的时候将每个基金所有的收益率情况请拿下来。
ok,那就直接用官网定的标签去爬,采集上图圈出的数据字段。
第二步就是每个基金的详细持仓情况,看图:
主要包括基金的成立时间、规模、基金经理以及每个季度的详细持仓情况。
爬虫大致思路
-
爬取每个基金标签下的所有基金以及收益率情况
-
根据基金代码爬取每个基金得到详细指标
-
根据基金代码爬取每个基金的季度持仓情况
需要说明一下,第 2 步和第 3 步的数据不在一个页面下,第 2 步的数据通过页面解析可以拿到,第 3 步的数据是动态加载后呈现在页面上的,可以通过接口拿到数据。
限于篇幅,主要代码如下:
# 爬取每个基金的数据
rank_detail_data = []
position_data = []
error_funds_list = []
for row_index, data_row in data_rank.iterrows():
fund_code = str(data_row[‘基金代码’])
try:
‘’‘爬取页面,获得该基金的详细数据’‘’
position_title_url = “http://fundf10.eastmoney.com/ccmx_” + str(fund_code[1:]) + “.html”
print(‘正在爬取第 {0}/{1} 个基金 {2} 的详细数据中…’.format(row_index+1, len(data_rank), fund_code[1:]))
response_title = requests.g