[原创][爬虫学习·一]爬取天天基金网的基金收益排行信息

[原创][爬虫学习·一]爬取天天基金网的基金收益排行信息最近在学习爬虫,实验了几个简单的小demo,记录一二。首先我们打开天天基金网的基金收益排行页面,了解一下要爬取的页面,网址和截图如下:http://fund.eastmoney.com/trade/hh.html?spm=001.1.swh#zwf_,sc_1n,st_desc现在要爬取该页面下所有基金的代码、名称...
摘要由CSDN通过智能技术生成

[原创][爬虫学习·一]爬取天天基金网的基金收益排行信息

最近在学习爬虫,实验了几个简单的小demo,记录一二。

首先我们打开天天基金网的基金收益排行页面,了解一下要爬取的页面,网址和截图如下:

http://fund.eastmoney.com/trade/hh.html?spm=001.1.swh#zwf_,sc_1n,st_desc

 

现在要爬取该页面下所有基金的代码、名称、日增长率、近一周和近一月的增长率(也就是红框内的内容),并保存在Excel文件中。思路如下,

(1)设置Excel文件的格式。

1)引入xlwt工具

import xlwt

2)添加FundSheet页,并设置Excel文件的表头,用的是worksheet.write(row,col,label)方法,row为excel表的行,col为列,label是表格内容。

workbook = xlwt.Workbook(encoding ='utf-8')
worksheet = workbook.add_sheet('FundSheet')
worksheet.write(0, 0, label='基金代码')
worksheet.write(0, 1, label='基金名称')
worksheet.write(0, 2, label='日增长率')
worksheet.write(0, 3, label='周增长率')
worksheet.write(0, 4, label='月增长率')

这几行代码的设置效果如下:

(2)分析页面和爬取网站内容。

选取Selenium爬取工具,模拟浏览器对该网址发出请求。如果没有安装该工具,通过在cmd中执行

  • 4
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值