Python爬去百度图片表情包

关键是对网页格式的分析

import requests

for m in range(1,3):
    url='https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E8%A1%A8%E6%83%85%E5%8C%85&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&word=%E8%A1%A8%E6%83%85%E5%8C%85&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=&fr=&pn='+str(30*m)+'&rn=30&1517662599209='
    header={
        'User - Agent':'Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 60.0.3112.113Safari / 537.36'
    }
    html = requests.get(url, headers=header)

    # 解决乱码问题
    html.encoding = 'utf-8'

    # 200
    #print(html.status_code)

for n in range(30):
    #print(html.json()['data'][n]['thumbURL'])
    # 图片网址
    urll = html.json()['data'][n]['thumbURL']
    # 用于取名字
    urls = html.json()['data'][n]['thumbURL'][-20:]
    # 以二进制方式
    data = requests.get(urll).content
    # print(urls)
    with open('C:\\Users\\wwxy\\PycharmProjects\\untitled6\\' + urls, 'wb') as f:
        # 写入本地
        f.write(data)




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值