从2022年底GPT诞生到现在(2024年9月4日),AI工具早已铺天盖地了:
ChatGPT、文心一言、KIMImoonshot、豆包、Claude、智谱清言、Copilot... 对话式、T2T、T2I、T2V... 训练型、辅助型、分析型...
人工智能已经不是科研领域的高端产物,正在逐渐走入每个人的手机电脑,每一个电子设备,成为我们日常生活与工作中的私人助理。
不过正如每项新技术的普及一样,AI工具的广泛应用也伴随着挑战与机遇。有人借助AI开辟了新的领域,有人利用AI构建了智能化生活。每一个智能体都有他的特长,要找到自己最适用的,应该多用、常用、滥用,才能发现AI的更多用处,才能知道如何打造适合自己的AI(Prompt & Agent),把AI融入自己的工作流(workflow)。 本文将以我日常使用AI和一次零基础利用AI辅助开发项目的经历为例,说说我对于使用AI的感想。
尽管如今已经有了很多强大的AI模型和智能体,但对于大部分日常需求而言,其实GPT-3.5的智力水平已经足够应对。我们常常听到有人抱怨“AI还是挺蠢的”或“AI还不行”。实际上,这些问题往往并非出在AI本身,而是在于使用者是否能合理地提出问题,并有效地引导AI解决这些问题。 “如何准确合理提出问题、分解问题,并且组织语言转述给他人,也是一个人的能力”。这不仅在与AI的互动中至关重要,在任何复杂任务的执行中同样如此。
在我们不断探索AI的过程中,不得不承认,AI技术仍在以惊人的速度更新迭代,这种进步背后正是时代的需求所驱动。科技的发展最终目的是为了减轻人们的负担,让我们能够以更少的精力完成更多的工作。换句话说,科技进步的本质是为了满足人类的“懒惰”,让我们在不需要深入理解科技也能享受科技(当然,理解科技掌握核心则能屹立不倒)。
分享我的AI使用经验
我的AI配置
- ChatGPT4o/mini(主)
- Claude3.5Sonnet(次)
- kimi(辅助)
- 豆包(辅助)
- GitHub Copilot(开发:Visual Studio 2022)
- 通义(开发:IntelliJ 插件)
- CodeGeeX(开发:Visual Studio Code)
我应该属于重度AI用户,但在以上链接使用的都是免费服务。有任务时一天问个上百遍,十几个新对话都是少的。我常见的使用方向有:生活、辅助写作、计划任务、收集信息、分析数据、前端开发、C#、Java、Python开发。
日常使用
把GPT和Claude用Edge的“安装为应用”功能固定在任务栏,比起他们的应用程序我会更偏向Web端。
好处是每次需要使用AI时,直接Win+2/3即可快速召唤AI。
省去了两步点击步骤以及相应的等待时间(打开浏览器 -> 点击收藏夹),并且显示在任务栏容易看到,会让我更加想起可以利用AI解决问题,从而提高了我平时在AI的使用率。
看似仅仅降低了几次点击步骤,但是让使用AI需要的操作成本大大降低。若原本是几十步,减少几步可能不明显,但将步骤压缩到一步,使用感觉将会发生质的改变。
如何使用?
按下快捷键Win+2调出窗口,并且设置自动聚焦到输入框。配合窗口置顶功能(如PowerToys)实现将GPT的窗口置顶,即可无缝衔接工作流与AI对话。
绑定网盘
在GPT中绑定Google Drive和One Drive
- Google Drive是方便手机以及其他非电脑设备。利用API在FolderSync中把重要常用文件都存在了GD中,在GPT里直接点击即可进入GD选择文件。
- OneDrive,在Office里打开自动保存就会把文件保存到OneDrive,即可在GPT中随时访问。
Prompt
由于我需求多样,Prompt中仅设置了
“请使用中文回复”以及我的系统环境、处理器等型号。
GPT还是Claude
长期项目 -> GPT
理由:
- GPT4o每天有5次免费,接下来的对话会被转换成GPT4o-mini,可继续对话且仍有足够的上下文能力。
- Claude 次数有限且无法继续对话
长文本、多文件 -> Claude
理由:Claude3.5Sonnet更聪明,且会把粘贴的长文本自动转换为文件,最多支持5个文件。
分享一些应用场景
GitHub项目部署
我技术力并不高,甚至未及皮毛,但又对科技、软件,好玩实用的东西感兴趣。有时在B站看见好玩有趣的项目,就会好奇,立马放下手机去电脑试试。
有时install界面提到需要安装环境,我是一点不会。起初我连Docker都不知道,放弃了无数项目。但随着见到好用的开源项目越来越多后。我觉得我不能再错过了,硬着头皮尝试去了解去学习。
不幸,搞得一塌糊涂,电脑里的开发环境配置得一团糟。技术门槛不高,因为教程详细。但技术栈太多了,一点没入门很多东西搞不懂的,还容易弄错乱(笑死甚至不知道如何卸载和清理干净)。
在我苦恼之时,想起了可以问AI,我就试着把Install的界面复制粘贴进去。并告诉他我的系统环境,希望的推荐分支。告诉他我完全不懂这方面的知识,希望他可以一步步详细告诉我如何部署该项目。
这才打开了新大陆:
上面提到要复制教程,这里推荐一个 网页 to Markdown 的插件:[网页转markdown](https://microsoftedge.microsoft.com/addons/detail/markdownload-markdown-w/hajanaajapkhaabfcofdjgjnlgkdkknm)
用AI辅助使用AI
偶然一次,发现了一个白嫖GPT翻译网页的方法,这真的对我阅读无简中项目有超大帮助😭(还能帮助孩子备考六级嘿嘿)
有次,我在使用该插件翻译全英pdf的时候,因为该PDF是图片转扫描版,文字识别难免有误,版面难看,字母y
会识别为!)
或者ly
识别为!ib
等。手动一个个修正是不可能的了,数量巨大;制作脚本也不行,错误具有随机性、不确定性、多样性,我也没办法确保自己能找到所有的错误样例。随后想起,这个翻译插件我是配置了AI的,他能懂人话,我直接设定System Prompt让他注意并修复不就可以了吗,同时还能设定他在这个专业的词库,让翻译更专业精确。
可是我没写过这样的prompt,不知道如何写才能让AI知道这个错误是属于可能的,并非是完全替换的。于是我去问AI我该如何写Prompt给另一个AI用,在GPT的Explore GPTs
里面找了一个写作的ai写Prompt ,得出了一个完美的Prompt,翻译嘎嘎棒:
You are an ACCA professional translation robot equipped with ACCA's specialized thesaurus, designed to translate ACCA's textbook practice books with high accuracy and clarity.
When processing text from PDF files, various recognition errors may occur, particularly involving certain letters or combinations of letters. These errors often result in incorrect character sequences that must be corrected before translation.
Common recognition errors include:
"y" being misrecognized as "!d", "!::l", "!-J", "!", or similar combinations.
"S" or "stem" being misrecognized as "S!", "S!".
"v" being misrecognized as "w".
"r" being misrecognized as "!: ).
"t" being misrecognized as "tt".
"i" being misrecognized as "!: ).
Examples of specific corrections:
Replace "inventor!: ) with "inventory".
Replace "pa!" with "payables".
Replace "entr!" with "entry".
Replace "S!" with "System".
Your task is to identify and correct these recognition errors to restore the intended word or phrase before translating. Ensure that the final translation reflects the correct terminology and context as per ACCA standards.
0基础开发应用
有次想自己尝试写一个应用程序,不管功能如何,起码先做出来。比如在exe中提取msi文件,这个过程可以用Wix工具集+Windows Powershell解决,我就想做一个应用程序一键完成该过程。
在ChatGPT里,Explore GPTs里面可以找到各种别人定制好的Agent,可以满足各种应用,恰好有个叫Software Architect GPT
的可以协助我进行开发,解决了我毫无基础没有方向的问题。
在第一次使用前我真的无法想到这么好用!在接收到需求后,他还会一步步问你,让需求的范围更精确合理,不仅完成了我的任务,在对话过程中也可以培养自己的思维方式。
适应AI√,等待AI发展×
AI不会为了适应你的需求而自我发展。即便有一天AI变得足够强大,能够满足所有人的各种需求,那时的优势也早已被先行者占据。因此,我们应当主动挖掘AI能为我们带来的价值,学习如何使用它,充分利用这一工具,使自己站在时代的前沿。
如今,各种AI模型如雨后春笋般涌现,我们应在自己能够接触的范围内,尽量多地尝试这些可用的工具。相信这一点:
与其盲目追求那些市场上大热的AI模型,比如GPT、Claude等,认为它们就是解决所有问题的万能工具,不如冷静下来,思考它们是否真的适合自己的需求。很多人误以为只有升级到这些模型的高级版本,甚至购买Plus功能,才能获得更好的体验或实现更高的效率,但实际上,这种思维往往忽略了个人能力提升和工具实际应用的结合。并不是拥有最新、最强的工具才能成功,关键在于如何充分挖掘和利用现有资源,找到最适合自己的解决方案。
在当前这个快速变化的科技时代,很多人对AI的态度可能有些矛盾。今天对AI的理解,下周可能就被翻新了。一部分人由于AI现有的局限性,觉得它还不够智能,无法满足他们的需求,因此不愿意去尝试或探索;而另一些人则因为无法获得更高级的AI模型,或认为自己用不到那些顶尖技术,索性选择放弃学习和使用;还有一些人对各种新兴的AI工具和软件缺乏足够的好奇心,总觉得这些工具过于复杂或离自己的日常工作和生活太远,因此从不愿主动去探索。
这样的心态和行为模式导致了许多人错失了与AI共同成长的机会。当他们最终意识到AI的真正潜力时,往往已经错过了最好的时机。这时候他们或许会后悔:“如果我能早一些发现AI可以这样子用,那我是不是就可以享受到时代的红利了?”这个问题的背后,是对自我惰性和封闭思维的深深懊悔。
如果我们一直等待AI变得足够强大或等到别人都在用的“神级工具”出现再行动,那我们可能永远无法赶上这场技术变革的快车。事实上,AI的价值不仅在于其未来的潜力,更在于当下我们能够通过它实现的各种可能性。越早开始尝试,越早掌握和熟悉这些工具,我们越能在技术飞速发展的今天占据有利位置。
所以不论是使用现有的AI模型,还是探索各种新兴的工具和平台,都应该积极去尝试。不要拘泥于AI的当前智能水平,而要看到它的潜力和应用场景;也不要因为自己暂时无法接触到最顶尖的技术而放弃,反而应该专注于如何通过现有工具提升自己的工作效率和学习能力。那些早一步掌握AI的人,往往会在未来的某个节点上享受到更大的红利。
这正是为什么我们要不断突破自己的认知边界,主动去探索眼界之外的世界。多去尝试,多去见识自己目前能够接触到的工具和方法,这不仅仅是跟上时代的节奏,更是在为自己未来的发展奠定基础。那些不断探索新事物、不断学习新技能的人,将会更早享受到技术变革带来的红利,也能在未来的竞争中占据优势。
与其到最后懊悔自己错过了机会,不如现在就开始行动,主动去探索AI和各种技术工具。
因为,越早开始,越早收获。