python简单图片爬虫

简单爬虫获取京东商城手机商品图片

由于近年来python语言的火热程度,于是便开始入坑,由于技术有限,学了两周,才只能实现一个简单的爬虫。
主要功能:爬取京东商城手机销售页面的手机图片,将其下载到本地文件夹。
代码如下:

import urllib.request
import re

def f(url,page):
	http = urllib.request.urlopen(url).read() #打开传入的页面
	http = str(http) #将网页内容转换为str类型
	obj = '<img width="220" height="220" data-img="1" src="//(.*?\.jpg)">' #正则表示图片所存的网址
	#img = re.compile(obj).findall(http)
	img = re.findall(obj,http) #将http中符合正则表示的保存在img列表,上行有同样效果
	index = 1
	for i in img:
		s = 'http://' + index #将图片网址加上(http://)前缀使其可以访问
		try:
			urllib.request.urlretrieve(s,"./img/pic"+str(page)+str(index)+".jpg") #(urlretrieve)可以将s下载到对应的目录
		except urllib.request.URLError as e:
			pass
		else:
			index += 1

for i in range(1,80):
	url = 'https://list.jd.com/list.html?cat=9987,653,655&page=' + str(i) #前为京东手机选购的网址,page 为该网页的所在的页数
	f(url,i)

图片下载情况:
爬取的手机图片

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值