Ajax爬取微博

最新推荐文章于 2023-10-29 22:50:45 发布

ReScale

最新推荐文章于 2023-10-29 22:50:45 发布

阅读量442

点赞数 1

分类专栏： python爬虫文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Reserve_Scale/article/details/90145325

版权

根据书上的案例写的，但是案例太老，所以案例中给的微博地址访问后，居然打开了移动端的微博页面，其余的网络请求界面，网络请求回应的数据大体上跟书上的内容一致，但是如果爬取的是现在的微博网址的话，书上的案例教程搭配不上，所以下面的代码爬取的是移动端的微博网址。

爬取结果：
在这里插入图片描述

原理介绍

有很多网页不是静态网页，当你直接使用get请求网页时，返回的html代码中其实没有包含任何有用的信息，那些你需要的信息还没有被网页渲染上去，我们实际在网页中浏览的信息是由JavaScript处理后生成的结果，这些数据是由原网页发送了一个Ajax请求，通过请求返回的数据，再次渲染网页。

准备工作

安装urllib，pyquery，json，requests模块。没有安装的，直接pip install 模块名就行，如果还安装不下了，就升级一下pip版本。

流程解析

第一步：查看Ajax请求

为了获取到通过Ajax请求后渲染的网页数据，我们首先要知道网页发送了什么样的Aja

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Ajax爬取微博

根据书上的案例写的，但是案例太老，所以案例中给的微博地址访问后，居然打开了移动端的微博页面，其余的网络请求界面，网络请求回应的数据大体上跟书上的内容一致，但是如果爬取的是现在的微博网址的话，书上的案例教程搭配不上，所以下面的代码爬取的是移动端的微博网址。爬取结果：原理介绍有很多网页不是静态网页，当你直接使用get请求网页时，返回的html代码中其实没有包含任何有用的信息，那些你需要的信息还...
复制链接

扫一扫

专栏目录

ReScale CSDN认证博客专家 CSDN认证企业博客

码龄7年

61: 原创

11万+: 周排名

73万+: 总排名

4万+: 访问

: 等级

1032: 积分

10: 粉丝

30: 获赞

5: 评论

81: 收藏

私信

关注

热门文章

分类专栏

LeetCode周赛 2篇
shell 1篇
Android基础 16篇
UML建模 2篇
算法 4篇
POJ 2篇
SQLite 1篇
第一行代码笔记 3篇
Servlet 1篇
MySQL 2篇
xml 1篇
零散知识点 1篇
Struts2 2篇
Python 2篇
python爬虫 7篇

最新评论

parseRequest(request)类型不匹配问题
坐怀不乱书哥哥: 特么的 , 我找了几天问题了... 我还以为是jdk版本问题...
parseRequest(request)类型不匹配问题
Watkinstord: 而且3.0+新版本得导入 import org.apache.tomcat.util.http.fileupload
parseRequest(request)类型不匹配问题
Watkinstord: 同样的问题呀菜鸟教程上的sevlet 栗子有点过时了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。