python爬虫(轻音乐网)

该Python爬虫程序用于从轻音乐网站抓取并下载不同类型的音乐,包括纯音乐、新世纪、钢琴曲等。它使用requests库处理HTTP请求,通过BeautifulSoup解析HTML页面,同时使用多进程Pool进行并行下载,提高效率。爬虫还包含代理IP池以应对可能的反爬策略,并能根据网站结构抓取歌曲名称和ID,将MP3文件保存到本地。
摘要由CSDN通过智能技术生成
#-*-coding:utf-8-*-
__author__ = 'qinlan'

import requests
import time,os,random,pymongo
from prettytable import PrettyTable as pt
from bs4 import BeautifulSoup
from multiprocessing import Pool

proxies = [
        '115.224.163.58:61202','179.184.9.172:20183',
        '177.37.166.164:20183','103.55.69.242:53281',
        '217.61.106.183:80','45.125.220.242:8080',
        '103.88.140.85:8080','218.26.227.108:80',
        '110.171.230.47:8080','118.81.108.77:9797',
        '31.145.83.198:8080','195.88.208.115:3128'
]

agent = [
    'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1',
    
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值