- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 【6】获取局部刷新的数据3
从Query String Parameters中可以发现请求参数与URL能对应上。”就是我们输入的“学习”,当当网页面经过处理得到的是“
2024-11-07 14:25:23
350
原创 【5】获取局部刷新的数据2
上一节爬取哔哩哔哩局部刷新的数据,发起请求的方式是GET。但是很多网站获取局部刷新数据的方式采用POST请求,这一节就是讲解POST请求获取局部刷新数据的案例实现。
2024-11-07 14:24:49
65
原创 【3】伪装已登录的用户
nodejs程序携带Cookie发起请求,那么网页收到请求发现Cookie会认为请求者已经登录,于是就可以直接返回页面。一个网站可能有多个服务器,不同页面可能编码方式不同(比如当当网首页采用GBK编码,购物车页面则采用UTF8编码,且服务器地址Remote Address和域名都发生变更),因此我们最好更新所有的请求头信息。如上图所示,设置Cookie信息后,使用nodejs程序进行请求就不会跳转登录页。
2024-11-07 14:21:04
167
原创 【2】简单防止爬虫ip被封
【2】简单防止爬虫ip被封1. 伪装浏览器身份防止爬虫ip被封,最简单的方案就是伪装身份,可以简单理解为请求的头信息就是HTTP请求者的身份证。要以浏览器的身份发起爬虫请求。就要伪造请求的头信息。User-Agent :就是身份证的民族+地区,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"表明HTTP请求者是Wind
2021-01-10 12:49:44
557
原创 【1】执行Http请求访问网页
【1】执行Http请求访问网页1. 目标网址我们的目标网址是当当网,url地址是 http://book.dangdang.com/![image.png](https://img-blog.csdnimg.cn/img_convert/4670493f01dee4dc86511f571f86a45c.png#align=left&display=inline&height=609&margin=[object Object]&name=image.png&or
2021-01-10 12:43:58
715
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人