python用户名和密码登录_Python爬虫:账号密码登入扇贝

这篇教程详细介绍了如何使用Python进行网页登录,以扇贝网为例,包括获取URL、构建data和headers、POST请求登录、获取并解析网页数据。文章包含代码实现,并解释了GET和POST请求的区别,以及如何处理动态网页数据。
摘要由CSDN通过智能技术生成

写在前面的话

网上的教程都太简单了(代码又太难了),我摸索了好一阵。所以这是一个特别啰嗦的教程,每一步都有截图。

整个流程:

确保你的库都全了

用账号密码登入网页

取读炼句信息

清洗数据

保存数据到Excel

附完整代码

734fd64bd4c2

代码运行界面

老规矩:安装库

import requests

import json

import re

import xlwt

确认一下,你有没有requests和xlwt的库,没有的话,装一下

如果不装,代码运行不起来,你双击.py文件,就直接闪退了

如果你在调试中运行,那会报错

734fd64bd4c2

安装`requests`的界面如下

账号密码登入

基本步骤:

(1)获取网址,得到【URL】

(2)输入账号密码,得到【data】

(3)构建Request Headers,得到【headers】

(4)登入网页

(1)URL

首先,网页类型分为两种,静态和动态的

静态页面

动态页面

非结构化数据:HTML

结构化数据:json,xml等

处理方式:正则表达式,xpath, beautifulsoup4

处理方式:直接转化为python类型

以扇贝网为例,浏览器为360极速浏览器

网址:

https://web.shanbay.com/web/account/login

扇贝网里面,部分网页是静态的,部分是动态的

734fd64bd4c2

右击“审查元素”,或者F12,打开开发人员工具

点击“Network”,把Preserve Log勾选上,在左下角那个框里输入“login”(表示只看登入信息)

输入账号密码,登入网页

734fd64bd4c2

登入后,显示如下

734fd64bd4c2

734fd64bd4c2

补充,请求方式Request Method一般有两种,GET和POST

GET: 请求的URL会附带查询参数

POST: 请求的URL不会附带查询参数

postUrl = 'https://apiv3.shanbay.com/bayuser/login'

(2)包含账号密码的data

刚刚那个界面,往下滑到最后

我们看到,请求是Request Payload,里面包含了我们账号密码的信息

734fd64bd4c2

还有一种方式是Form Data,具体区别可参考

HTTP请求中的form data和request payload的区别

我们这里就讲Request Payload,现在扇贝用这个

PayloadData = {

'account': "1********9",

'code_2fa': "",

'password': "Z*************6"

}

(3)headers

还是刚刚那个界面,网上翻一点,就能看到Request Header,我们选取其中部分信息,构造一个头

734fd64bd4c2

我们选

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值