python爬取今日热榜数据到txt文件

BugMiaowu2021

于 2021-02-21 19:48:36 发布

阅读量2.3k

点赞数 5

分类专栏： # Python爬虫文章标签： python 爬虫

本文链接：https://blog.csdn.net/m0_46278037/article/details/113922326

版权

使用Python爬虫技术获取https://tophub.today/的今日热榜数据，并将其整理后保存到TXT文件中，实现数据的文本记录。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今日热榜：https://tophub.today/

在这里插入图片描述

爬取数据及保存格式：

在这里插入图片描述

爬取后保存为.txt文件：

在这里插入图片描述

部分内容：

在这里插入图片描述

源码及注释：

import requests
from bs4 import BeautifulSoup

def download_page(url):
    headers = {
   "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
    try:
        r = requests.get(url,timeout = 30,headers=headers)
        return r.text
    except:
        return "please inspect your url or setup"


def get_content(html,tag):
    output = """