Python抓取url链接不变化的表格数据

简介

在使用python进行爬取数据时,有时会遇到表格筛选条件变化但上方链接不变化的情况。本文介绍一种简单的方法,爬取数据。
例子为nba-stat网站的 [http://www.stat-nba.com/team/ATL.html]
直接获取到的html文件无法爬取18-19或者往期赛季的数据,只能爬取到当前界面的表单数据(19-20赛季).

步骤

  1. F12 打开 开发调试工具.点击Network后刷新界面

  2. 比如要爬取18-19赛季数据,点击页面中的小标题后发现有新的网络活动.

  3. 这个新的活动的url就是一个表格,表格链接,只需按照普通网页爬取步骤(我用的是bs.findall().get_text()后再用re)即可得到所需的数据(然后分析这个链接中的相关元素即可爬取以往赛季或者其他球队的数据.
    (http://www.stat-nba.com/team/stat_box_team.php?team=ATL&season=2018&col=pts&order=1&isseason=1
    比如team的值一改就是别的队的18赛季数据了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值