python爬虫爬取图片代码_Python使用爬虫抓取美女图片的代码详解

本文详细介绍了如何使用Python编写爬虫,从www.qiubaichengren.com网站抓取美女图片,并将它们保存到本地。通过实例演示了User-Agent设置、URL请求、HTML解析及图片下载的全过程。
摘要由CSDN通过智能技术生成

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考,具体如下:

图片资源来自于www.qiubaichengren.com

代码基于Python 3.5.2

友情提醒:血气方刚的骚年。请

谨慎阅图!

谨慎阅图!!

谨慎阅图!!!

code:

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import os

import urllib

import urllib.request

import re

from urllib.error import URLError

class QsSpider:

def __init__(self):

self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

self.header = {'User-Agent': self.user_agent}

self.save_dir = './pic'

self.url = 'http://www.qiubaichengren.com/%s.html'

def start(self):

for i in range(1, 10):

self.load_html(str(i))

def load_html(self, page):

try:

web_path = self.url % page

request = urllib.request.Request(web_path, headers=self.header)

with urllib.request.urlopen(request) as f:

html_content = f.read().decode('gb2312')

# print(html_content)

self.pick_pic(html_content)

except URLError as e:

print(e.reason)

return

def save_pic(self, img):

print(img)

save_path = self.save_dir + "/" + img.replace(':', '@').replace('/', '_')

if not os.path.exists(self.save_dir):

os.makedirs(self.save_dir)

print(save_path)

urllib.request.urlretrieve(img, save_path)

pass

def pick_pic(self, html_content):

regex = r'src="(http:.*?\.(?:jpg|png|gif))'

patten = re.compile(regex)

pic_path_list = patten.findall(html_content)

for i in pic_path_list:

self.save_pic(str(i))

print(i)

spider = QsSpider()

spider.start()

代码运行后可得到如下N多大饱眼福的美女图:

155953D2920F-12539.jpg

希望本文所述对大家Python程序设计有所帮助。

以上就是本次给大家分享的关于java的全部知识点内容总结,大家还可以在下方相关文章里找到相关文章进一步学习,感谢大家的阅读和支持。

您可能感兴趣的文章:

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值