python爬虫(qq音乐)

该博客演示了如何使用Python进行QQ音乐的爬虫实现,通过多进程Pool下载Linkin Park的歌曲。首先定义代理、User-Agent等请求头,然后获取搜索结果页面,解析音乐链接并下载MP3文件。主要涉及requests库、正则表达式和JSON解析。
摘要由CSDN通过智能技术生成
#-*-coding:utf-8-*-
__author__ = 'qinlan'

import requests
import time,os,random,re,json
from multiprocessing import Pool

keyword = 'Linkin Park'

proxies = [
        '115.224.163.58:61202','179.184.9.172:20183',
        '177.37.166.164:20183','103.55.69.242:53281',
        '217.61.106.183:80','45.125.220.242:8080',
        '103.88.140.85:8080','218.26.227.108:80',
        '110.171.230.47:8080','118.81.108.77:9797',
        '31.145.83.198:8080','195.88.208.115:3128'
]

agent = [
    'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1',
    'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6',
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36',
    'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24'
]


headers = {
        'referer':'https://y.qq.com/portal/search.html',
        'User-Agent':random.choice(agent)
    }

session = requests.Session()

def parseMainHtml(page):
    base_url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp?'
    params = {
        #URL可变参数如下
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值