python爬虫学习45

亦瑕

于 2022-06-02 23:17:04 发布

阅读量669

点赞数 2

文章标签：爬虫 python 学习

本文链接：https://blog.csdn.net/szshiquan/article/details/125108290

版权

本文介绍了在Python中使用requests库抓取Ajax动态加载数据的方法。通过分析网页参数，发现limit与offset用于分页，成功获取了Ajax响应中的电影信息。这展示了如何应对JavaScript渲染的网页，以及使用logging追踪请求日志。

摘要由CSDN通过智能技术生成

python爬虫学习45

Ajax数据爬取

3.初步探索

首先我们使用requests库来实际操作一下

# https://spa1.scrape.center/

import requests

url = 'https://spa1.scrape.center/'
html = requests.get(url).text
print(html)

运行结果:

在这里插入图片描述

这里我们虽然能够成功获得返回的html文本，但是对比实际网站我们就会发现事情远远没有那么简单：

对比网站上的内容就会发现我们没有在返回的html中发现任何的电影信息。

在这里插入图片描述

对于以上情况，就说明该网页使用了JavaScript渲染的技术之后得到的。这个时候若要爬取页面的电影信息我们需要调用Ajax数据接口，以实现对动态渲染之后的页面的爬取。

这时我们首先要对页面进行分析：

在这里插入图片描述

再进行下一页操作之后，可以看到比较明显两个参数：limit与offset

在这里插入图片描述

查看每一个响应的preview选项卡，可以看到我们所需的信息就隐藏在这里！
就想捉迷藏一样，看到它的下一步，就是把他们抓住了。

import requests
import logging
# 调用logging库进行程序日志的打印输出，以便对爬虫进程的监督

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

亦瑕

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python爬虫作业

weixin_56914091的博客

05-25

446

import urllib.request import ssl import re import xlwt import xlrd from xlutils.copy import copy import DBUtils def getContent(k,l): headers={ "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.377

python中的limit是干嘛用的_sql中limit使用方法

weixin_39906114的博客

12-06

992

此处以mysql为例，但是我相信物以变通在oracle上也一定适用1、下面是几种limit的方法：原则看看下面几个例子应该就懂了在数据库中很多地方都会用到，比如当你数据库查询记录有几万、几十万时使用limit查询效率非常快，只需要查询出你需要的数据就可以了·再也不用全表查询导致查询数据库崩溃的情况。select * from Customer LIMIT 10;--检索前10行数据，显示1-10条...

3 条评论您还未登录，请先登录后发表或查看评论

新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

热门推荐

橘子派

07-11

2万+

新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（SVM）简介新闻分类系统可以对十种新闻进行自动分类并显示准确性的结果。（交叉验证准确性在65%~70%，数据集一共3183，可增加数据集提高准确率。）系统分为三部分：爬虫部分，使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站，其实

PYTHON函数

Limit_Fly的博客

04-28

2454

文章目录带参数的函数必备参数默认参数不定长参数可变参数关键字参数内置函数部分内置函数使用示例enumerate()eval()exec()filter()map()zip()匿名函数递归函数回调函数闭包global关键字nonlocal关键字为了避免重复的写一段功能，将重复的功能写成一个函数，当需要的时候通过调用函数，从而达到节省代码的功能。 python中函数的定义关键字是: def 定义一个...

python中limit()和offset()的用法

weixin_43226574的博客

02-21

1万+

python中limit()和offset()的用法 limit()限制结果集每次值查询几条数据 offset()可以限制查找对象数据的时候过滤掉多少条切片,可以对Query对象使用切片操作,来获取想要的数据,可以使用 select(start,stop)方法来求片操作,也可以使用'[start:stop] 的方式来进行切片操作, 在实际开发中,中括号形式的是用处较多的,希望大家掌握 #enc...

python limit_Python MySQL Limit

weixin_39638304的博客

12-10

222

限制结果数量可以使用“LIMIT”语句，限制查询返回的记录数量:示例在“customers”表中，选择前5条记录:import mysql.connectormydb = mysql.connector.connect(host="localhost",user="你的用户名",passwd="你的密码",database="mydatabase")mycursor = mydb.cursor()...

基于python爬虫学习项目源码.zip

09-23

基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习...

python 爬虫学习资料.zip

11-12

Python爬虫学习资料是一个丰富的资源集合，旨在帮助初学者和有经验的开发者深入理解Python爬虫技术。Python作为一门简洁且强大的编程语言，是网络爬虫领域的首选工具，因其易于学习且拥有众多相关的库和框架。一、...

python爬虫学习笔记-scrapy框架(1)

01-29

python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python ...

python爬虫学习44

szshiquan的博客

05-30

577

python爬虫学习44 目录python爬虫学习44Ajax数据爬取1. 什么是Ajax2.分析Ajax Ajax数据爬取有时我们使用request抓取页面时，经常出现我们获取到的内容和我们在浏览去实际看到的内容不一致的情况，这是由于我们通过requests得到的结果都是原始的HTML文档，而浏览器的页面是经过JavaScript数据处理之后的结果，这些数据有多种来源：通过Ajax加载包含在HTML文档中经过JavaScript和特定算法处理后生成我们今天要处理的问题就是第一种来源的数据，通

python爬虫学习笔记-scrapy框架(2)

01-29

python爬虫学习 scrapy框架爬虫学习 scrapy python爬虫学习 scrapy框架爬虫学习 scrapy python爬虫学习 scrapy框架爬虫学习 scrapypython爬虫学习 scrapy框架爬虫学习python爬虫学习 scrapy框架爬虫学习python...

Python爬虫实例1

qq_51557623的博客

10-09

1239

Python爬虫实例1 爬取猫眼电影TOP100（http://maoyan.com/board/4)的相关内容 step1 准备工作目标：爬取猫眼电影TOP100的电影名称、时间、评分、图片分析：第一页URL：https://maoyan.com/board/4，展示了排行1-10的电影；第二页URL：https://maoyan.com/board/4?offset=10，展示了排行10-20的电影； … 获取TOP100，需要分开请求10次，参数offset分别为：0，10…90 step

Python MySQL Limit

吴吃辣

09-16

1226

章节Python MySQL 入门 Python MySQL 创建数据库 Python MySQL 创建表 Python MySQL 插入表 Python MySQL Select Python MySQL Where Python MySQL Order By Python MySQL Delete Python MySQL 删除表 Python MySQL Update Python MyS...

python中的limit是干嘛用的_python limit必须是整数

weixin_39936086的博客

12-06

774

我试图运行以下代码但由于某种原因我得到以下错误：“TypeError：limit必须是一个整数”.读取csv数据文件import sysimport csvmaxInt = sys.maxsizedecrement = Truewhile decrement:decrement = Falsetry:**csv.field_size_limit(maxInt)**except OverflowEr...

爬虫爬出来的数据是空的_Python 爬虫没有思路？可以看看这篇文章

weixin_39574140的博客

12-11

4156

可以说爬虫是学习 Python 的入门必修课。当能独立写出第一个完整的爬虫的时候，我们已经迈出了一大步。因为在这过程中，我们已经学会了如何查看文档，学会使用 Python 相关库的操作，怎样使用 Chrome 的开发者工具（相关工具）和把抓取的数据保存到数据库中等等一系列操作，当然收获最多的还是学习 Python 的自信心。如果大家如果在自学遇到困难，想找一个Python学习环境，可以加入我们的P...

python爬虫学习43

szshiquan的博客

05-26

313

python爬虫学习43 目录python爬虫学习43数据存储篇——MySQL储存6. 删除数据7. 查询数据数据存储篇——MySQL储存 6. 删除数据执行删除语句要使用 delete ：现在数据表students中有以下三条数据： import pymysql database = pymysql.connect(host='localhost', user='root', password='123456', port=3306, db='spider1') cursor = databas

python爬虫学习课件