用代码回复博客

本文讲述了如何使用代码模拟HTTP请求来实现数据爬取、点赞、评论回复等功能。

内容包括:

1.抓包软件WireShark的简单使用方法

2.Python库requests的基本使用

3.一个用代码回复博客的例子


一、思路阐述


首先,要模拟HTTP请求,我们要知道被模拟的真实HTTP它到底包含了哪些东西。它的 目标URL是什么, 参数是什么,是不是带 cookie?除此之外还包括了哪些(比如 Header)
为了获取这些信息,我们可以使用抓包软件WireShark来 捕获我们真实提交请求时的数据

这里解释一下为什么要用WireShark?(Chrome浏览器本身其实也自带类似功能,有兴趣的朋友可以去研究下,但是我还是觉得抓包软件牛逼)
你可能觉得我要模拟HTTP请求来提交表单,只要看下网页源代码中的form表单有哪些字段就可以了。
没错,对于一些耿直的安全防护水平低的网站来说,这个方法确实可行。但 对于大多数网站是行不通的

拿某博客网站做例子,看到它源代码中有个表单域如下:



然而我开着抓包软件,在真实地完成一次评论操作后,获取到的POST请求是这样的:

评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值