Python教程;一起爬取娱乐圈的排行榜数据

本文介绍如何使用Python爬虫从123粉丝网获取娱乐圈排行榜数据,包括男、女明星人气榜,通过分步和批量爬虫代码解析,教你高效处理数据。
摘要由CSDN通过智能技术生成

想关注你的爱豆最近在娱乐圈发展的怎么样吗?本文和你一起爬取娱乐圈的排行榜数据,来看看你的爱豆现在排名变化情况,有几次登顶,几次进了前十名呀。

一、网站原始信息

我们先来看下原始的网站页面

如果我们想一个一个复制这些数据,再进行分析,估计要花一天的时间,才可以把明星的各期排行数据处理好。估计会处理到崩溃,还有可能会因为人为原因出错。

而用爬虫,半个小时不到就可以处理好这些数据。接下来看看怎么把这些数据用Python爬下来吧。

二、先来看下爬取后数据的部分截图

1 男明星人气榜数据

2 女明星人气榜数据

三、如何获取123粉丝网的爬虫信息

以下是获取代码用到信息的具体步骤:

  • step1:浏览器(一般用火狐和Google我用的360)中打开123粉丝网
  • step2:按键盘F12 -> ctrl+r
  • step3: 点击results.php -> 到Headers中找到代码所需的参数

四、分步爬虫代码解析

1 用Python中的Requests库获取网页信息

新手学习,Python 教程/工具/方法/解疑+V:itz992

#爬取当前页信息,并用BeautifulSoup解析成标准格式
import requests  #导入requests模块
import bs4

url = "https://123fans.cn/lastresults.php?c=1"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值