喜欢编程,热爱分享,希望能结交更多志同道合的朋友,一起在学习Python的道路上走得更远!
本文教大家如何用python爬取网站的mv视频,话不多说直接上代码!
爬取网站的地址:http://www.170mv.com/mlmv
from urllib import request,response
import re,urllib
import requests
def pa(url):
a=0
hader={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0'} #请求头,模拟浏览器
da=urllib.request.Request(url,headers=hader)
date=urllib.request.urlopen(da) #发送请求
html=date.read().decode("utf-8") #编码转换
lianjie=re.findall('<a class="clip-link" data-id="(.*?)" title="(.*?)" >',html,re.S) #提取mv列表的链接
for i,l in enumerate(lianjie):
a=a+1
lianjie=l[0]
da=urllib.request.Request("http://www.170mv.com/mlmv/%s.html" %lianjie,headers=hader)
date=urllib.request.urlopen(da)
html=date.read().decode("utf-8")
url=re.findall('http://www.170mv.com/tool/jiexi/ajax/pid/%s/(.*?).mp4' %lianjie,html,re.S)
name=re.findall('<h1 class="entry-title">(.*?)</h1>',html,re.S)
url='http://www.170mv.com/tool/jiexi/ajax/pid/%s/%s.mp4' %(lianjie,url[0])
url = requests.get(url).content
print("正在下载第%s首mv" % a)
f = open('E:\\mp4\\{}.mp4'.format(name[0]), 'wb')
f.write(url)
f.close()
print("下载成功")
我是一名python开发工程师,整理了一套python的学习资料,从基础的python脚本到web开发、爬虫、
数据分析、数据可视化、机器学习、面试真题等。想要的可以进群:688244617免费领取
觉得文章还可以的话不妨点个赞,有任何意见或者看法欢迎大家评论!