爬取表情包

爬取表情包

import urllib.request
import re
import os
path=r'D:\猫'
os.makedirs(path)
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
urllib.request.install_opener(opener)
"""
for q in range(1,3):
    pageurl="http://www.doutula.com/search?type=photo&more=1&keyword=%E7%8C%AB%E7%8C%AB&page="+str(q)
    data=urllib.request.urlopen(pageurl).read().decode("utf-8","ignore")
    pat='data-original="(.*?)"'
    imagelist=re.compile(pat).findall(data)
    for w in range(0,len(imagelist)):
        thisimg=imagelist[w]
        thisimgurl=thisimg
        file="D:/狗/"+str(q)+str(w)+"cat.gif"
        urllib.request.urlretrieve(thisimgurl,filename=file)
"""
for i in range(6,7):
    pageurl="http://www.doutula.com/search?type=photo&more=1&keyword=%E7%8B%97%E7%8B%97&page="+str(i)
    data=urllib.request.urlopen(pageurl).read().decode("utf-8","ignore")
    pat='data-original="(.*?)"'
    imagelist=re.compile(pat).findall(data)
    for j in range(0,len(imagelist)):
        thisimg=imagelist[j]
        thisimgurl=thisimg
        file="D:/猫/"+str(i)+str(j)+"dog.gif"
        urllib.request.urlretrieve(thisimgurl,filename=file)
        

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值