selenium 爬取某基金网站数据

# coding: utf-8
from selenium import webdriver
import time

driver = webdriver.Chrome()

driver.get(
    'http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;szzf;pn100;ddesc;qsd20170531;qed20180531;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb')
i = 1
while i < 41:
    i = i + 1
    driver.find_element_by_xpath('//label[@value={}]'.format(i)).click()
    time.sleep(5)
    trs = driver.find_elements_by_xpath('//table[@id="dbtable"]//tr')
    for tr in trs:
        ths = tr.find_elements_by_xpath('./td')
        with open('foundation.csv', 'a', encoding='utf-8') as f:
            for th in ths:
                f.write(th.text.replace('\n', '\r\r') + ',' if th.text else '')
            f.write('\n')
        print('保存成功')

这个网站的基金数据是jQuery请求返回的,然后通过渲染到页面上,请求下一页也是ajax请求进行局部刷新,

但是,这个ajax返回的数据是类似于js脚本的格式,不好直接提取,因此采用的selenium模拟点击的方式,

点击下一页按钮,直到没有最后一页,通过xpath提取页面的数据,存入csv文件中,方便在excle或者pandas分析。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值