Python爬虫17行代码抓取唱片信息

最新推荐文章于 2024-03-07 18:06:39 发布

越洋飞机

最新推荐文章于 2024-03-07 18:06:39 发布

阅读量443

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_40916315/article/details/115014525

版权

本文展示了如何使用Python爬虫在17行代码内抓取discogs网站上的唱片名称、艺人和发行年份。通过requests和bs4库实现网页请求和HTML解析，构建并执行HTTP请求，获取并提取所需数据，最后将信息写入TXT文件。这种方法可扩展以满足更多需求，如保存图片或进行词频分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Python爬虫17行代码抓取唱片信息

目标网站是discogs,大概是全网唱片信息最全的网站。
需求是爬取每张唱片的唱片名，歌手/乐队和发行年份（也可以根据需要添加需求，简单改一下代码就行）
网站长这样：（以kc为例） discogs
先上代码

import requests
from bs4 import BeautifulSoup

headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/87.0.4280.141 Safari/537.36 Edg/87.0.664.75'}
num = input('输入专辑总数\n')
uid = input