用chrome插件实现cookie同步

本文介绍了如何开发一个Chrome插件来实现cookie的自动保存和同步,以解决爬虫或机器人登录问题。通过插件,可以捕获并更新用户的登录状态,避免手动处理过期cookie。文章详细讲解了插件的开发过程,包括manifest.json、content.js和background.js的编写,实现了从浏览器到云端数据库的cookie同步。
摘要由CSDN通过智能技术生成

场景描述

做过爬虫或者机器人的朋友一定会遇到登陆的问题:大多数的网站需要登陆之后才能读取内容或者执行操作。要实现网站的自动化登陆和操作,大概的方法有两种:1,通过Chrome无头浏览器-selenium等工具模拟登陆,然后通过控制selenium实现和网站的交互操作;2,将包含已登陆信息的cookie设置到HTTP请求当中,直接通过HTTP request进行交互;这两种方法各自适用不同的场景,互相不能替代。但总的来说,当已经摸清服务器HTTP API的时,第二种方法是最直接有效,代码也是最简洁的。

面对的问题

对于第一种方法来说,最麻烦的是处理现在越来越繁复的验证码校验。虽然google和baidu 都有发布过一些包可以识别图片中的验证码,但准确率并不高;并且遇到需要手动拖拽的防机器人校验还得加入复杂的js代码进行动作模拟;

对于第二种方法,关键是如何获取cookie并妥善的处理cookie中登陆token过时的问题。我这篇文章提供一个简单的解决思路,虽然没有完全的自动化,但是只是部分解决了获取cookie和将cookie同步到机器人端的问题

解决思路

首先,我们需要在平时我们访问网站的时候,能够自动的将cookie保存下来,并且发送到云数据库中,方便机器人获取该cookie

其次,在每次机器人运行对应的工作时,都到云数据库中获取对应网站最新的cookie,再执行自动化操作。

这样做的好处在于:

  1. 我们不需要写复杂的代码去模拟登陆
  2. 每次我们访问常用网站的时候都会将最新的cookie更新到数据库,避免机器人使用的cookie过时

比如,我访问csdn,可以从下图看到,chrome已经自动导出了我的cookie,并且同步到了我的aws dynamoDB当中。
在这里插入图片描述
要让chrome能实现这样的行为,我们需要自己开发chrome插件,所幸的是,代码量并不大。

使用插件主要基于以下原因:

  1. 对于大部分的用户登陆信息(user token等)来说,在保存到cookie中时,都带了HTTP_ONLY的flag,这个flag作为一个安全机制,目前基本已经成为一个业内标准。即当cookie中的值被标记为HTTP_ONLY时,在js脚本中无法通过document.cookie获取。即,如果你希望在js中获取当前页面的cookie时,document.cookie只能获取部分内容(非HTTP_ONLY)。而chrome plugin因为有更高的操作权限,可以通过chrome.cookies接口获取所有的cookie
  2. 因为我们期望的操作是获取用户登陆信息并同步到远端,数据安全尤为重要,以插件的方式进行操作,可以有效的隔离危险,防止被窥探

chrome cookie share插件开发

我这里只提一下重点,贴一下代码,关于具体的教程可以自行在网上搜索。这里给出google chrome的开发者官网。对接口有不清楚的可以到这上面去看一下。

项目结构

CookieShareHelper lex$ tree
.
├── images
│   ├── star_128px.ico
│   ├── star_132.png
│   ├── star_16.png
│   ├── star_16px.ico
│   ├── star_24.png
│   ├── star_24px.ico
│   ├── star_32px.ico
│   ├── star_33.png
│   ├── star_48px.ico
│   ├── star_49.png
│   ├── star_64px.ico
│   ├── star_66..png
│   ├── star_72px.ico
│   ├── star_74.png
│   ├── star_96px.ico
│   └── star_99.png
├── js
│   ├── aws-sdk.min.js
│   ├── background.js
│   └── content.js
└── manifest.json

主要的只有三个文件:

  • manifest.json
  • content.js
  • background.js

manifest.json

类似node开发里的package.json,里面定义了chrome插件的信息和结构。

{
   
  "manifest_version": 2,
  "name": "Cookie分享工具",
  "version": "1.0",
  "description": "将常用的网站的cookie保存到dynamoDB上,方便爬虫等工具直接使用",
  "icons": {
   
    "16": "images/star_16.png",
    "48": "images/star_49.png",
    "128": "images/star_132.png"
  },
  "browser_action": {
   
    "default_icon": {
   
      "19": "images/star_24.png",
      "38": "images/star_49.png"
    
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值