Python3爬虫：selenium模拟登录获取cookie提取数据，存入数据库MySQL

最新推荐文章于 2024-06-05 15:10:27 发布

八月长安tsliao

最新推荐文章于 2024-06-05 15:10:27 发布

阅读量9.1k

点赞数 4

分类专栏： Python爬虫 Python爬虫文章标签： Python3 mysql

本文链接：https://blog.csdn.net/weixin_43837330/article/details/91865315

版权

本文介绍了使用Python3的selenium库进行模拟登录，获取cookie，然后将数据存入MySQL数据库的过程。详细讲述了如何处理iframe框架中的元素定位问题，以及如何设置定时任务实现自动化抓取数据。

摘要由CSDN通过智能技术生成

selenium模拟登录获取cookie提取数据

Python3 爬虫

Python3 爬虫

因为工作需要selenium爬取数据，所以写一下自己的整个流程以及过程中踩过的坑，希望能帮到大家！

selenium模拟登录获取数据

如果不想自动化窗口弹出，添加option就可以实现，因为我是设置定时执行的，所以每次弹出很不方便。

这里遇到的第一个坑，是element定位账号密码输入框的时候一直出现错误，后面发现原来在iframe框架里面，直接定位是不成功的，需要转换并且注明框架对应的名称。

通过selenium的get_cookies得到cookie在转换成json格式保存下来，再通过for循环转换成headers里面cookie一样形式的字符串，就可以直接引用了。
我抓取的网站是json格式的，所以get请求之后就直接转换成json按照字典的规则提取就可以了。
保存数据可以多种形式，我一般是存到数据库，方便保存跟查询。

下面是源码，我都注释好了。

from selenium import webdriver
import time
import json
import datetime
import requests

option=webdriver.ChromeOptions()
option.add_argument('headless') #添加无头浏览
browser = webdriver.Chrome(options=option)
browser.get('登录网址')
time.sleep(5)#设置延时，保证页面加载完成
browser.switch_to.default_content()

最低0.47元/天解锁文章

八月长安tsliao

关注

4
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
Python3爬虫：selenium模拟登录获取cookie提取数据，存入数据库MySQL

selenium模拟登录获取cookie提取数据Python3 爬虫selenium模拟登录获取数据Python3 爬虫因为工作需要selenium爬取数据，所以写一下自己的整个流程以及过程中踩过的坑，希望能帮到大家！selenium模拟登录获取数据如果不行自动化窗口弹出，添加option就可以实现，因为我是设置定时执行的，所以每次弹出很不方便。这里遇到的第一个坑，是element定位账...
复制链接

扫一扫

专栏目录