今天,你摸鱼了吗?
上班压力大,上学太辛苦,感觉身体被掏空。当代年轻人为了应付马不停蹄的工作,在忙碌的生活中寻求一丝“劳逸结合”,摸鱼一词应运而生,休息,是为了更好的工作!(虽然这时候,你的老板可能就要开始发怒了)
随着小红书、抖音、B站、微博等社媒平台的蓬勃发展,摸鱼的成本越来越低,手机一打开,几个平台换着看看:“我重生了,这一世……”、“家人们,谁懂啊,……”,再来几个精彩的美女小视频,几个无厘头的搞笑整活视频,下一次放下手机,好像就要到饭点了。时间是打发了,但是工作愣是一点没做啊!
为了解决摸鱼导致的效率低下问题,今年即将在卡内基梅隆大学攻读计算机科学博士的 James Campbell 利用自己的空闲时间,开发出了这么一款应用 —— ProctorAI,它可以实时监控你的屏幕,进行截图,并且交给咱们的大模型好伙伴对你的屏幕截图进行分析。如果你被逮到正在做一些“低效率”的事情,那么 ProctorAI 则会对你进行一些“友好”的提醒。
作者本人是这么形容 ProctorAI 的:项目的目标就是成为图上这样一位女性,当你看 Facebook 一眼,就给你一个响亮的耳光!但 ProctorAI 可以随时提供服务(美队音:I can do this all day),而且更严苛,还能全面了解您的工作情况。
那么,进入应用后,你可以看到这样的一个界面:
你可以告诉 ProctorAI 今天的任务是什么。比如作者自己对它说,今天的任务是一个ML可解释性项目。我只能打开 VS Code,一个终端,以及一个只能用于工作用途的浏览器。
那么,现在就可以愉快的开始工作了。
当打开 StackOverflow 的时候,ProctorAI 对屏幕截图进行分析,OK,这家伙在正经工作,查资料呢。
不过你要是想忙里偷闲,累了刷会推,那么不好意思,这时候 ProctorAI 发现了这个页面似乎跟你最开始说的“工作用途”不相符,屏幕的右边已经出现了红色的warning。接下来,咱们的监管者就要开始采取措施了。
这时候,ProctorAI会弹出一个窗口,上面有这些小字,大致意思是:好啊你,我看你的机器学习项目是不是太无聊了,甚至去刷推了?似乎,推特并不是 Python 生态的一部分,请你关闭你的小鸟(推特的老图标),马上飞回 VS Code 老巢,否则你的工作效率就会被我打一个又大又胖的零!
更好玩的是,AI会用语音提醒你,就好像真的有一个人在屏幕背后训话。这时候,你必须签保证书,保证关闭推特回到VS Code。
随后屏幕上就会出现倒计时,你必须在倒计时结束前服从管教,继续工作。
ProctorAI 的工作原理是每隔几秒钟(以指定的时间间隔)对您的电脑进行截图,然后将截图输入一个多模态模型,如 Claude-3.5-Sonnet、GPT-4o 或 LLaVA-1.5。如果 ProctorAI 认为您没有集中注意力,它就会控制您的屏幕,并向您发出个性化信息。在您保证不再拖延之后,ProctorAI 会给您 15 秒钟的时间来关闭拖延源,否则就会继续骚扰您。
作者说到,ProctorAI是一个智能系统,知道什么是拖延,什么不算是拖延。ProctorAI 能够理解细微的工作流程。在每次 Proctor 会话之前,用户都要输入他们的会话规范,明确告诉 Proctor 他们打算做什么,在会话期间允许哪些行为,不允许哪些行为。因此,Proctor 可以处理诸如 “我可以上 YouTube,但只能观看 Karpathy 关于 Makemore 的讲座 ”这样的细微规则。这是其他任何生产力软件都无法实现的灵活性。就像是拥有生命力一样!
那么,要怎么样才能体验到 ProtocolAI 呢?好消息是,这是一个开源项目。所以,作者提供了一套详细的部署流程,大致如下:
-
使用
git clone
命令将 ProctorAI 项目从 GitHub 仓库克隆到你的本地机器上。
git clone https://github.com/jam3scampbell/ProctorAI
-
进入项目目录后,使用
python -m venv
命令创建一个名为 focusenv 的虚拟环境。
cd ProctorAI
python -m venv focusenv
-
激活刚才创建的虚拟环境
source focusenv/bin/activate # MacOS、Linux
focusenv\Scripts\activate # Windows
-
使用
pip
命令安装项目所需的所有依赖包
pip install -r requirements.txt
-
设置环境变量(替换实际的Api Key)
# MacOS、Linux
export OPENAI_API_KEY="your_openai_api_key"
export ANTHROPIC_API_KEY="your_anthropic_api_key"
export GEMINI_API_KEY="your_gemini_api_key"
export ELEVEN_LABS_API_KEY="your_eleven_labs_api_key"
# Windows
set OPENAI_API_KEY=your_openai_api_key
set ANTHROPIC_API_KEY=your_anthropic_api_key
set GEMINI_API_KEY=your_gemini_api_key
set ELEVEN_LABS_API_KEY=your_eleven_labs_api_key
-
启动运行
./run.sh
这样,你就可以和作者一样,拥有一个实时监控你效率的小管家了。关于运行成本,作者也说到,诸如apikey等所有成本,大约会在50美分/天。比起获得的工作效率,是可接受的范围。
很多网友对 ProtocolAI 表现出了浓厚的兴趣,认为这的确是一款有效提升效率且很有趣味性的应用。不过也有部分网友说到,这或许是走向了错误的方向,我们应该让AI给我们提出提升效率的建议,而不是通过“监控”来约束行为。
对于这个酷似监管者的项目,你怎么看?
项目地址:
https://github.com/jam3scampbell/ProctorAI