Python爬虫系列(四)(简单)Dota排行榜爬取,并存入Excel表格

在编写Python程序的时候,有很多库供我们选择,如urllib、requests,BeautifulSoup,lxml,正则表达式等等,使得我们在获取网页源代码或者选择元素的时候很方便,但是库多了,自己纠结症也犯了。。。额。自己今天爬的是对战平台的DOTA排行榜(ps:我在简书看到的一个评论,关于这个网站的,索性自己爬下了-_-),巩固下知识吧。

1531909-933a22722674ac9c.png
排行榜

1、分析网站

打开开发者工具,我们观察到排行榜的数据并没有在doc里

1531909-fe1ba117208807af.png
doc文档

在Javascript里我么可以看到下面代码:

1531909-9da33ce8aee85d5f.png
ajax的post方法异步请求数据

在 XHR一栏里,我们找到所请求的数据

1531909-3b008fa3457c3d63.png
json存储的数据

请求字段为:

1531909-218c4ce65e22c66d.png
post请求字段

2、伪装浏览器,并将json数据存入excel里面


1531909-991c57a01697324e.png
获取玩家信息


1531909-df5ce55e9fceb13a.png
将数据保存到excel中

3、结果展示


1531909-0ad9e042291b60a8.png
保存的数据

4、总结

在掌握一些基本的爬虫知识之后,自己想做一些爬虫进阶的实战项目,比如使用一些框架(scrapy、pyspider等)、还有使用代理池等等。还有很多知识要学习自己加油吧。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值