python爬虫技术实现图片提取

# -*- coding: UTF-8 -*-
import urllib2,urllib,os
'''
Created on 2017年4月16日

@author: 恋蝶
'''
mmurl = "https://mm.taobao.com/json/request_top_list.htm?type=0&page="
temp = "https://mm.taobao.com/self/aiShow.htm?spm=719.7763510.1998643336.1.pI7wQq&userId="
T = '''src="'''
wjming = "E:\\Pythonpaqu\\Python\\picimg\\"
i = 0
ph = -1
while i < 16:
    url = mmurl + str(i)
    up = urllib2.urlopen(url)
    cont = up.read()
    ahref = "user_id="
    target = '''target="_blank"'''
    h=1
    pa = cont.find(ahref)
    pt = cont.find(target, pa)
    while cont.find(ahref)>=0:
        userid = cont[pa + len(ahref): pt - 2]
        grzxurl = temp + userid
        mmup = urllib2.urlopen(grzxurl)
        imgcont = mmup.read()
        mtname = cont[pa + len(ahref): pt + 36]
        mta = '''target="_blank">'''
        mtb = '''</a>'''
        mtapa = mtname.find(mta)
        mtapb = mtname.find(mtb,mtapa)
        wjname = mtname[mtapa + len(mta) : mtapb]
        wjname = str(i) + wjname + str(h)
        h +=1
        zzwjm = wjming + wjname
        isExists=os.path.exists(zzwjm)
        if not isExists:
            os.makedirs(zzwjm)
        print (zzwjm)
        imgsty = '''img style="float:'''
        tstar = "tstar.jpg"
        imgpa = imgcont.find(imgsty)
        imgpt = imgcont.find(tstar,imgpa)
        l=1
        while imgcont.find(imgsty)>=0:
            whileimg = imgcont[imgpa + len(imgsty): imgpt+9]
            imgcont = imgcont[imgpt:]
            imgpa = imgcont.find(imgsty)
            imgpt = imgcont.find(tstar,imgpa)
            temurl = whileimg.find(T)
            imgurl = "http:" + whileimg[temurl + len(T):]
            urllib.urlretrieve(imgurl, zzwjm +"\\tu"+ str(l) + ".jpg")
            l +=1
        cont = cont[pt:]
        pa = cont.find(ahref)
        pt = cont.find(target, pa)
    i += 1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值