在看完入门级讲解之后,不知道要干什么,看到一个群里的大佬说python的方向,就先想着学一下爬虫。刚好在听歌,就想着把歌单弄下来,然后就开始我的纠结之旅。
在和度娘的无数次交流和自己的多次懵逼排错中,这个代码总算是出来了,实现了效果,但是就是速度有点慢。话不多说,上代码
# coding:utf-8
import urllib.request
import urllib
import re
import requests
from openpyxl import workbook
from bs4 import BeautifulSoup
def getdeslist(html):
#获取需要的信息
soup = BeautifulSoup(html, 'lxml')
list_pic = soup.select('ul#m-pl-container li div.u-cover-1 img')
list_name = soup.select('ul#m-pl-container li div a.msk')
list_num = soup.select('ul#m-pl-container li div.bottom span.nb')
list_author = soup.select('ul#m-pl-container li p a.s-fc3')
base = 'http://music.163.com'
#将每页的歌单信息写入表中
for i in range(len(list_pic)):
ws.append([list_pic[i]['src'],list_name[i]['title'],base+list_name[i]['