心情不美丽,爬了一些美图,独自欣赏!

小屌丝:鱼哥,咋了, 心情不美丽?
小鱼:嗯,
小屌丝:晚上撸串去??
小鱼:不
小屌丝:蹦迪??
小鱼:不
小屌丝:喝酒??
小鱼:不
小屌丝:猎艳??
小鱼:… !!
于是乎~~ 一段代码上来, 某网站的美女图片被下载下来!

直接上代码

#coding = utf-8
"""
@ auth : carl_DJ
@ time : 2020-7-22
"""

import urllib.request
import os 


def  url_open(url):
	'''打开url'''
	req = urllib.request.Request(url)
	
	req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36')
	response= urllib.request.urlopen(req)
	
	html = response.read()
	return html

def get_page(url):
	'''获取page数'''
	html=url_open(url).decode('utf-8')
	
	
	a = html.find('current-comment-page')+23
	b = html.find(']',a)
	#print(html[a:b])
	return html[a:b]
	
def find_imgs(url):
	'''锁定要爬取的图片'''
	html = url_open(url).decode('utf-8')
	img_addrs=[]
	
	a = html.find('img src=')
	while a!= -1:
		b = html.find('.jpg',a,a+255)
	
		if b != -1:
			#print(html[a+9:b+4])
			img_addrs.append(html[a+9:b+4])
		else:
			b = a+9

		a = html.find('img src=',b)
	return img_addrs
	#for each in img_addrs:
	#	print(each)


def save_imgs(folder,img_addrs):
	'''保存图片'''
	for each in img_addrs:
		print(each)
		filename = each.split('/')[-1]
		with open(filename,'wb') as f:
			img = url_open('http:'+each)
			f.write(img)


def download_mm(folder='mm',pages=10):
	'''下载到指定路径'''
	os.mkdir(folder)
	os.chdir(folder)

	url = 'http://jandan.net/ooxx/'
	page_num = int(get_page(url))
	print(page_num)
	for i in range(pages):
		page_num -= i 
		page_url = url+'page-'+str(page_num)+'#comments'
		print(page_url)
		img_addrs = find_imgs(page_url)
		save_imgs(folder,img_addrs)

		
if __name__=='__main__':
	download_mm()

小鱼:只有工作,才能让我不美丽的心情,晴朗起来!
小屌丝:鱼哥,要不是看到你爬取的这些图片,,我差点信了你说的话!!!
小鱼: 你… 相煎何太急~ ~~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Carl_奕然

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值