人人网登录并写留言板(Requests,js逆向)

本文介绍了如何使用Python的Requests库进行人人网登录和发布留言板信息的步骤,重点解析了登录过程中涉及的JS逆向,包括MD5加密、signature签名的生成等关键环节。最后展示了爬虫如何发送POST请求完成这些操作。
摘要由CSDN通过智能技术生成

一、简介

        主要实现人人网登录以及发布留言板信息

        requests js逆向

二、实现过程

        2.1 登录(案例使用账号为18888888888 密码123456 后面成功登录使用的是自己的账号)  

                登录链接 https://www.renren.com/login

                先不说多,抓个包放松一下

                

                 post请求了 https://rrwapi.renren.com/account/v1/loginByPassword 这个url ,请求参数为 appKey、callId、password、sessionKey、sig和user。

                一个一个分析:

                        appKey多次调试后发现是写死的,这就很好办,pass。

                        callId显然是一个时间戳,虽然不知道他有没有别的骚操作,但是在这里我们就暂且当作时间戳,后面分析JS代码的时候在看看。

                        password 显然是一个加密过的密码,它的长度是32位,有一定js逆向经验的就不难猜到可能是md5加密,因此我尝试了一下,果然就是密码123456的md5加密,ok pass

                        sessionkey是空的,不管,这个参数登录的时候置为空就好

                        sig 这是一个signature签名,这个才是最重要的一个参数,他也是32位,也可以试着猜测它是md5加密,至于本质是什么,分析JS代码后再下定论。

                        user 这个显然就是我们的账号了

2.2 追栈

        在搜索sig关键字的时候结果太多,因为之前猜测sig是md5加密,因此我们尝试搜索md5,于是我们不难找到下面的一段代码:

使用Pythonrequests库进行网络爬虫,我们可以方便地爬取各种网站上的数据,包括领导留言板。 首先,我们需要确定领导留言板的URL地址。可以通过浏览器进入相关网站,找到领导留言板的入口,并复制URL地址。 接下来,我们使用requests库发送一个HTTP GET请求,获取到领导留言板页面的内容。可以使用get()函数,传入URL地址作为参数。 然后,我们可以对返回的页面内容进行解析并提取所需的数据。可以使用第三方库,如BeautifulSoup,可以方便地处理HTML文档。使用BeautifulSoup将页面内容转化为一个可操作的对象,并可以使用其提供的方法,如find()、find_all()等,来筛选出我们需要的信息。 在解析页面内容时,我们可能需要查看领导留言板中的HTML结构,确定需要提取的标签及其对应的属性。可以使用浏览器的开发者工具,查看源代码并查找相关标签。 解析完页面后,我们可以将所需的信息保存到一个数据结构中,比如列表。可以根据页面结构的不同,使用循环或条件语句来提取多个留言的内容。 最后,我们可以将获取到的数据保存到本地文件中,或者进行进一步的分析和处理。 在使用requests库进行爬取领导留言板时,需要注意一些限制和规范。比如,不要过于频繁地发送请求,以免给服务器造成压力。可以通过设置适当的时间间隔来控制请求的频率。此外,还要注意网站的robots.txt文件,遵守网站的爬虫协议,避免违反规定。 总之,使用requests库进行网络爬虫,可以方便地爬取领导留言板等各种网站上的数据,只要我们能确定URL地址并了解页面的结构,就可以通过解析和提取,得到我们想要的信息。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值