看到多网页爬取肯定感觉很高端大气上档次吧!其实鬼都不是。我们现来分析下网页
其实网址就是后缀不一样而已。那应该怎们处理呢
url = 'https://nba.hupu.com/teams/' + list_name[i]
就这样就搞定了。
剩下的就开始爬去NBA大佬们的信息了。
先来个热身导入几个库玩玩。
然后活动两下拿下网页的代码。
大显身手的时候来了
先分析一波看看浏览器上怎们显示的
我们要的信息都在这里x_list,x_title中。
几个循环就这样搞定了。
下面就开始收尸了。
这样就拿到我们的数据了。