爬虫入门--按关键字爬取网络图片

本文介绍了作者的第一个Python网络爬虫项目,该爬虫能根据输入的关键字和数量,从百度图片下载相关主题的图片并保存到本地。涉及Python基础、urllib2库、网络错误处理、Windows下的中文乱码问题以及Python文件操作。
摘要由CSDN通过智能技术生成

网络爬虫第一站,我参考一些资料,写下了个人的第一个简单地网络爬虫程序,麻雀虽小,五脏俱全。
该爬虫程序的功能是,根据输入的图片关键字以及所要的图片数量,从百度图片上下载设定数量的对应主题图片,并保存到本地对应文件夹中。开发过程中涉及到的网络爬虫知识,主要有以下几个方面,一是python基础知识,二是python urllib2库的使用,三是实际爬取过程中出现的各种网络错误及解决方法,四是windows下中文乱码问题,五是python文件操作知识。
先上完整的代码,后面再作简要说明:

# -*- coding: utf-8 -*-
"""
Created on Thu Aug 25 19:50:42 2016

@author: Administrator
"""
import re
import os
import urllib2
import cookielib
import sys 
class bdImg:
    baseUrl = &
  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值