python爬虫实战(7)--获取it某家热榜

置顶 ChrisitineTX

已于 2024-01-11 11:10:19 修改

阅读量595

点赞数 9

分类专栏： python 爬虫文章标签： python 爬虫开发语言

于 2024-01-10 16:12:59 首次发布

本文链接：https://blog.csdn.net/qq_34252622/article/details/135504533

版权

爬虫同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

python

10 篇文章 0 订阅

订阅专栏

1. 需要的类库

import requests
from bs4 import BeautifulSoup
import pandas as pd

2. 请求榜单

def fetch_ranking_data():
    url = "https://m.xxx.com/rankm/" #某家
    response = requests.get(url)

    if response.status_code == 200:
        return response.content
    else:
        print(f"Error fetching data. Status code: {response.status_code}")
        return None

3. 解析响应

def parse_html(html_content):
    soup = BeautifulSoup(html_content, 'html.parser')
    rank_items = soup.find_all('div', class_='placeholder one-img-plc')

    data = []
    for rank_item in rank_items:
        rank_num = rank_item.select_one('.rank-num').text
        title = rank_item.select_one('.plc-title').text
        url = rank_item.select_one('a')['href']

        data.append({
            'Rank': rank_num,
            'Title': title,
            'URL': url
        })

    return data

4.输出文件

def create_excel(data):
    df = pd.DataFrame(data)
    df.to_excel('ranking_data.xlsx', index=False)
    print("Excel file created successfully.")

5. 成果展示

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/a8466ce70031413592bf778437bd4ca3.png

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ChrisitineTX

关注关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python爬虫实战(7)--获取it某家热榜

【代码】python爬虫实战(7)--获取it某家热榜。
复制链接

扫一扫

专栏目录

Python爬虫——简单网页抓取（实战案例）小白篇_python爬虫爬取网页数据

m0_61330806的博客

04-27

683

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。上面的urllib是可对网页发起请求，在我们实际的爬虫应用中，如果频繁的访问一个网页，网站就会识别我们是不是爬虫，这个时候我们就要利用Request来伪装我们的请求头。Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

Python爬虫实战笔记-股票爬取示例.md

08-27

内容全面介绍了Python爬虫的实战技巧。适合人群: 对Python爬虫技术感兴趣,想了解爬虫实际应用的开发者。文中代码示例详尽,有助于爬虫编程的理解和练习。能学到什么: 通过学习可以掌握爬虫的实战方法,如模拟登录...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫开发学习全教程第二版，爆肝十万字【建议收藏】

热门推荐

五包辣条的博客

10-17

4万+

大家好，我是辣条。上次整理的爬虫教程反响不错，但是还是有小伙伴表示不够细致，今天带了升级版，全文很长，建议先收藏下来。一、爬虫基础爬虫概述知识点：了解爬虫的概念了解爬虫的作用了解爬虫的分类掌握爬虫的流程 1. 爬虫的概念模拟浏览器，发送请求，获取响应网络爬虫（又被称为网页蜘蛛，网络机器人）就是模拟客户端(主要指浏览器)发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。原则上,只要是客户端(浏

Python爬虫之Scrapy框架系列（3）——项目实战【某瓣top250电影信息获取(1)

m0_61330806的博客

05-06

817

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~给大家准备的学习资料包括但不限于：Python 环境、pycharm编辑器/永久激活/翻译插件python 零基础视频教程Python 界面开发实战教程Python 爬虫实战教程Python 数据分析实战教程python 游戏开发实战教程Python 电子书100本。

Python爬虫之Scrapy框架系列（3）——项目实战【某瓣top250电影信息获取(2)

m0_61330806的博客

05-06

912

①　2000多本Python电子书（主流和经典的书籍应该都有了）②　Python标准库资料（最全中文版）③　项目源码（四五十个有趣且经典的练手项目及源码）④　Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤ Python学习路线图（告别不入流的学习）

Python爬虫实战--爬取斗鱼直播所有房间信息.zip

12-23

Python爬虫源码大放送：抓取数据，轻松搞定！想轻松抓取网站数据，却苦于技术门槛太高？别担心，这些源码将助你轻松搞定数据抓取，让你成为网络世界的“数据侠盗”。它们还具有超强的实用价值。无论你是想要分析...

Python-Python3爬虫实战JS加解密逆向教程

08-10

本教程"Python-Python3爬虫实战JS加解密逆向教程"聚焦于如何处理JavaScript加密和混淆的数据，以便在爬虫过程中获取有效信息。这通常涉及到对前端JavaScript代码的理解、逆向工程以及加解密算法的应用。下面，我们将...

Python爬虫数据分析-获取拉勾网公开招聘数据.zip

04-30

python爬虫案例源码，python爬虫学习，python爬虫案例，python爬取在线网站数据，python爬取网站数据，python数据分析，数据获取，项目实战，python爬虫小例子，python爬虫代码示例，python爬虫简单示例，python爬虫...

Python爬虫实战案例-爬虫与文本分析.pptx

06-20

Python爬虫实战案例-爬虫与文本分析.pptx

cv2读取和保存图片

m0_53291740的博客

07-12

cv2.imwrite('b\\img1.png',img)#b存在就可以保存进去。如果b存在，c不存在，程序不会报错，也不会保存图片。如果目录b不存在就会存到当前文件夹。

java集合工具类

最新发布

hejiefeng111的博客

07-12

224

【代码】java集合工具类。

面试题 21：解释 Python 中的 help() 函数和 dir() 函数？

专注于全栈开发领域

07-10

730

在Python中，help()和dir()是两个非常有用的内置函数，它们可以帮助开发者更好地了解Python对象和模块。

聊聊如何在内网下构建大模型微调环境

python1234567_的博客

07-12

515

LlamaFactory新版更新后，还是比较方便，只是说llamafactory-cli命令的确是有点蒙，踩个坑就好了。对于LlamaFactory微调来说，本身不难，毕竟都是配置；主要是在内网环境下的依赖包拉取安装是真麻烦，但其实也还好。走一遍的话，还是可以学到很多的。。

基数排序算法Python实现

PeterClerk的博客

07-09

524

基数排序算法实现

已解决 javax.xml.transform.TransformerFactoryConfigurationError 异常的正确解决方法，亲测有效！！！

小明的Java问道之路

07-08

2195

已解决 javax.xml.transform.TransformerFactoryConfigurationError 异常的正确解决方法，亲测有效！！！

java占位符替换五种方式

weixin_61478518的博客

07-08

518

在业务开发中，经常需要输出文本串。其中，部分场景下大部分文本内容是一样的，只有少部分点是不一样。简单做法是直接拼接字段，但是这会有个问题。后面如果想要修改内容，那么每个地方都要修改，这不符合设计模式中的开闭原则，面向应该对扩展开放，对修改关闭。如何解决这个问题？先来看现实生活中的例子，个人信息填写。一般会要填写表格，已经定义好了姓名，性别，年龄等字段，只要填写对应的个人信息就好了。在程序开发中，我们会预先定义好一个字符串模板，需要改动的点使用占位符。

守望数据边界：sklearn中的离群点检测技术

2401_85742452的博客

07-08

752

本文的目的是帮助读者更好地理解离群点检测，并掌握在sklearn中实现这些技术的方法。通过本文，我们了解到了sklearn中不同的离群点检测技术，并提供了实际的代码示例。Isolation Forest是一种基于随机森林的离群点检测方法，它通过随机选择特征和切分点来“孤立”离群点。在实际应用中，离群点检测可以帮助我们识别数据集中的异常行为，从而进行进一步的分析或采取预防措施。评估离群点检测的效果通常比较困难，因为没有绝对的标准。基于密度的方法，如DBSCAN，根据数据点的密度而非固定阈值来识别离群点。

华为910b推理Qwen1.5-72b

weixin_41549308的博客

07-12

519

910b部署推理大模型

python爬虫实战-阳光高考爬虫

12-11

阳光高考是一个为学生提供高考信息的网站，为了方便获取最新的高考资讯...总之，通过Python爬虫实战阳光高考网站，我们可以实现自动化获取高考信息的目的，为学生提供更便捷、及时的资讯，帮助他们更好地备考应对高考。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交