python爬取天天基金网全部基金的历史全部净值

本文介绍了如何使用Python爬取天天基金网的所有基金的历史净值数据。首先解析基金代码和名称接口,然后获取每个基金的起始日期,接着通过循环遍历每个基金的历史净值接口,最终将数据保存。爬取过程中利用了re、pandas和requests等模块,并通过XPath解析网页内容。
摘要由CSDN通过智能技术生成

**

天天基金网历史净值爬取

**

**

1.认识天天基金网的数据接口

1,这是所有基金代码、基金名称简称的集合http://fund.eastmoney.com/js/fundcode_search.js
在这里插入图片描述
数据量是接近9000条数据。这个可以简单的用个正则表达,re.findall("(.*?)",url_text)匹配一下存在电脑上。然后再弄成excel文件。比较简单。

2,基金历史净值的接口
url=‘http://fund.eastmoney.com/f10/F10DataApi.aspx?type=lsjz&code=110022&page=10&sdate=2019-01-01&edate=2019-02-13&per=1’
参数情况一目了然。 per=1值代表每页的数据量。最多可以有二十行,per=20。设置更高也没用。
另外可以自己设置起始结束日期。
为了代码更加简洁,我设置的每页数据量是1条。这样就更辛苦电脑了。
由于我们这要爬取全部的历史净值,所以要查询到每只基金的起始日期。
page=多少,就是第多少页。

**

2. 开始代码部分

**
1,使用模块:
re 模块,pandas模块,requests模块,xpath的基本使用。
我比较习惯使用的IDE是spyder 3 。
可以用 pip install spyder 安装

在这里插入代码片
# -*- coding: utf-8 -*-
"""
Created on Mon Aug 26 20:02:27 2019

@author: yys
"""
import pandas as pd
import requests
import re
from lxml import etree

2.这是可能用到的参

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值