上班摸鱼?不可能,AI 监控你屏幕,你敢偷懒,它就敢吼你

AI 应用层出不穷,现在又有人开发了一款屏幕监控的开源 AI 应用  -- 

ProctorAI

ProctorAI 是一款监视用户工作状态的多模态人工智能系统,它通过定时截屏并分析用户行为来判断用户是否在专注工作,如果检测到用户上班在摸鱼,ProctorAI 会通过控制屏幕并发送个性化提醒来干预。

445b2a2e493692ad02893baeb6bae836.png

打开应用后,显示如下,会询问你今天要做什么:

e9c7334e066eab4d3dd349fe3004f77f.png

你可以在输入框中写上:今天我计划研究一个 ML 的可解释性项目。

38cbebb3e7ddf9c3539ce4e30efb0001.png

只允许可以打开一个 VSCode 编辑器、一个终端和网页浏览器,但仅限于查阅相关资料。

711beeba2763839037a7a045354b7954.png

接着,点击"Start"按钮,应用程序将展示如下界面,并开始监控您的电脑屏幕,每隔几秒钟更新最新状态:

cc6bd48086c8793e538e75fa7c6823b0.png

如果您开始上班摸鱼,这款应用程序将分析您的行为是否与您的工作相关,并检查它是否符合您最初设定的规则,一旦判断为不符,该应用程序将采取措施控制您的屏幕。

f503f56f915415b7d7b5975880d7cd6a.png

如上图所示,一旦 AI 大模型检测到您正在"摸鱼",就会弹出一个无法关闭的全屏警告窗口,并发出语音提示:

d8d8fc636c2b93bc448a0425d06dfaae.png

Well, well, well, James! I see you've traded machine learning for mindless scrolling. Is your ML interpretability project so boring that you'd rather decipher the cryptic tweets of strangers? Last I checked, "X" wasn't part of the Python ecosystem. Close that bird app and fly back to your VSCode nest before I interpret your productivity as a big, fat zero!

翻译过来就是:

嘿嘿嘿,James!我看到你把机器学习换成了无聊的刷屏。你的机器学习可解释性项目真的这么无聊吗?你宁愿解读陌生人的神秘推文?我记得上次检查时,“X”还不是 Python 生态系统的一部分。关闭那个鸟类应用,赶快飞回你的 VSCode 巢穴吧,否则我会把你的生产力评为一个大大的零!

完成输入后,屏幕上将显示一个 15 秒的倒计时提示框,提醒您在倒计时结束前关闭不健康内容的浏览:

05440d0ee297b5a7125520f538fcd3b5.png

完整视频演示如下:

阅读完毕后,你将注意到屏幕下方有一行提示文字和一个文本输入框,它要求你输入一份承诺声明以继续工作:

请在下方输入框中填写以下内容,以继续你的工作:

我承诺将关闭 X,仅使用 VSCode、终端和必要的网络资源,并将我的注意力重新集中在我的机器学习可解释性项目上。

6421f5e4c803a024ee677282f17746cc.png

完成输入后,屏幕上将出现一个 15 秒的倒计时窗口,你需要在这个时间内关闭不想关的内容:

baf035f0385116dbfe751084dc9d3a16.png

通过这种方法,当你在工作、研究或学习时分心,系统会自动发出提醒。开发者James Campbell为了形象地说明ProctorAI的功能,引用了一个有趣的例子:

"计算机程序员Maneesh Sethi曾经采取了一种极端的方法来提高自己的工作效率:每当他开始上班摸鱼时,他都会雇佣一名女性在他脸上轻拍一下。这种方法让他的工作效率有了显著的提升。"

a61fd9fa6f2f279756a94a959b9a5f34.jpeg


ProctorAI

ProctorAI 旨在通过利用多模态 AI 技术来对抗拖延症。

ProctorAI 会持续监控你的电脑屏幕,按照设定的间隔截取屏幕截图,并通过 Claude-3.5-Sonnet、GPT-4o 或 LLaVA-1.5 等先进模型进行处理。

当 ProctorAI 检测到你在拖延时,它会介入并控制你的屏幕,发送个性化的信息,敦促你回到任务中,你需要承诺停止拖延,然后 ProctorAI 会给你 15 秒的宽限时间来消除干扰,否则它会继续提醒你。

功能特点

  • 实时监控: 利用计算机视觉和人工智能技术,对在线考试过程进行实时监控。

  • 人脸检测: 自动识别并检测考生的面部,确保考试期间没有作弊行为。

  • 动作分析: 检测考生的头部和眼睛运动,判断是否有可疑行为。

  • 记录和报告: 实时记录考试过程,并生成详细的报告,方便考官进行审核。

技术栈

  • 前端: 使用 HTML、CSS 和 JavaScript 构建用户界面。

  • 后端: 使用 Python 和 Flask 搭建服务器,处理图像和视频数据。

  • 计算机视觉: 利用 OpenCV 和深度学习模型进行人脸检测和动作分析。

安装

要启动 GUI,只需输入 ./run.sh。您可能会看到弹出窗口,要求允许终端访问某些程序,启用这些程序就可以了:

git clone https://github.com/jam3scampbell/ProctorAI
cd ProctorAI
python -m venv focusenv
source focusenv/bin/activate
pip install -r requirements.txt
./run.sh

参考链接:

https://github.com/jam3scampbell/ProctorAI

https://x.com/i/status/1813218640608829553

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值