获取当当前网页的跳转地址,当前页面为主页面数据,我们需要的数据别有一番天地,获取到网页信息提取出所有的跳转地址,获取到源码里的a标签就行当前网页的加载方式为静态数据,直接请求网页地址;
url = 'https://image.baidu.com/search/acjson?
从源代码里提取到所以的跳转地址
【这是个很简单的代码,不做详细思路解析了,平台对爬虫的文章的审核比以前严格很多了,代码我留着,有啥不懂的评论提出,或者私信我,我看到了都会解答】
import requests
import json
import time
import os
def crawl(page):
if not os.path.exists(‘D://111’):
os.mkdir(‘D://111’)
url = ‘https://image.baidu.com/search/acjson?’
header = {
‘Referer’: ‘https://image.baidu.com/search/index?ct=201326592&cl=2&st=-1&lm=-1&nc=1&ie=utf-8&tn=baiduimage&ipn=r&rps=1&pv=&fm=rs4&word’,
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36’
}
param = {
“tn”: “resultjson_com”,
“logid”: “11007362803069082764”,
“ipn”: “rj”,
“ct”: “201326592”,
“is”: “”,
“fp”: “result”,
“queryWord”: “NBA”,
“cl”: “2”,
“lm”: “-1”,
“ie”: “utf-8”,
“oe”: “utf-8”,
“adpicid”: “”,
“st”: “-1”,
“z”: “”,
“ic”: “”,
“hd”: “”,
“latest”: “”,
“copyright”: “”,
“word”: “NBA”,
“s”: “”,
“se”: “”,
“tab”: “”,
“width”: “”,
“height”: “”,
“face”: “0”,
“istype”: “2”,
“qc”: “”,
“nc”: “1”,
“fr”: “”,
“expermode”: “”,
“force”: “”,
“pn”: page,
“rn”: “30”,
“gsm”: “1e”,
“1615565977798”: “”,
}
response = requests.get(url, headers=header, params=param)
img = response.text
j = json.loads(img)
print(j)
img_list = []
for i in j[‘data’]: #获得j字典数据里面的data所对应的值 值是一个列表 通过for循环拿去列表里的每一个元素
if ‘thumbURL’ in i:
print(i[‘thumbURL’])
img_list.append(i[‘thumbURL’]) #追加到列表中
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
工具都帮大家整理好了,安装就可直接上手!
三、最新Python学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试宝典
简历模板
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!