Python爬取百度图片

注意:此代码只能爬取30张左右,如果有朋友能告知怎么提高张数,感激不尽!

import re
import requests
import urllib.request

# 非正经图片,请注意(我真的是为了学术!!!)
req = urllib.request.urlopen('https://image.baidu.com/search/index?ct=201326592&cl=2&st=-1&lm=-1&nc=1&ie=utf-8&tn=baiduimage&ipn=r&rps=1&pv=&fm=rs1&word=%E7%BD%91%E7%BB%9C%E7%BE%8E%E5%A5%B3&oriquery=%E7%BE%8E%E5%A5%B3&ofr=%E7%BE%8E%E5%A5%B3&sensitive=0&z=0&ic=0&width=0&height=0&latest=0&hd=1&copyright=0')
buf = req.read()

#"thumbURL":"http://img1.imgtn.bdimg.com/it/u=4211603615,2895194094&fm=26&gp=0.jpg
listurl = re.findall(r'"thumbURL":".+?\.jpg',buf.decode('utf-8'))
print(listurl)
strurl = re.sub(r'thumbURL":"','',str(listurl))
strurl = strurl.replace('[','')
strurl = strurl.replace(']','')
strurl = strurl.replace(' ','')
strurl = strurl.replace('\',\'','zhangru')
strurl = strurl.replace('\'','')
listurl = re.split(r'zhangru',strurl)


i = 1
for url in listurl:
    print(url)
    f = open('picnew\\'+str(i)+'.jpg','wb')
    response = urllib.request.urlopen(url)
    buf = response.read()
    f.write(buf)
    i += 1
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值