获取弹窗文本_批量下载北大法宝的法律法规文本

最新推荐文章于 2024-08-18 21:03:53 发布

寒山皓月

最新推荐文章于 2024-08-18 21:03:53 发布

阅读量5.3k

点赞数 8

文章标签：获取弹窗文本

本文链接：https://blog.csdn.net/weixin_30003217/article/details/112577939

版权

本文介绍了如何使用Python模拟登录北大法宝网站并批量下载法律法规文本，涉及模拟登录、浏览器批量下载流程、Python实现批量下载以及处理滑动验证码的方法，为大规模下载提供了自动化解决方案。

摘要由CSDN通过智能技术生成

引言

因项目需要，我计划从北大法宝下载一些法律法规文本，仅以此文记录我的心得体会。本文不会将项目涉及到的所有源代码都直接挂出来，只贴一些代码片段，聪明的你应该能够很轻松地把代码片段连成可用的完整脚本。

模拟登录

北大法宝的大部分功能都需要在登录状态下使用，我新注册的账号可以有7天的试用期，非常不错，美滋滋。如果老铁们愿意花点小钱的话，可以在某平台上买到一个可用的账号。

浏览器上的登录过程就不说了，只说一下python的模拟登录。

北大法宝的模拟登录非常简单，只要发送下面这个POST请求就可以了，可以看到用户名和密码都是以明文形式传递的。

图中的用户名和密码是假的

使用requests的Session()发送这个POST请求，就可以让服务器记住登录状态了。

def login(self, username, password):
        '''
            登录北大法宝，需要提供用户名与密码
            :param username: 用户名
            :param password: 与用户名相对应的密码
            :return None: Session会自动保持登录状态
        '''
        # 登录网址
        url = "https://login.pkulaw.com/login"

        # 使用Session发送POST请求，登录北大法宝
        self.s.post(url=url, data = {
    "LoginName": username, "LoginPwd": password}, headers=self.headers)