iThinkAir Code Interpreter 的原理解析

3 篇文章 0 订阅
2 篇文章 0 订阅

一年前OpenAI对Plus会员开放了Code Interpreter功能,有人说是王炸,有人说是核弹级更新,也有人说是继ChatGPT之后再度让人感受到震撼和颠覆的产品。到现在有关Code Interpreter的声音没那么大了,其实是渐渐融入到各种AI相关的应用中。

在去年Code Interpreter开放几天之后,iThinkAir也在自己的AI指令集中添加"代码解释器"指令,并给出"代码解释器"的十几个应用案例,比如:将图片转换为灰度图、使用词云统计高频词、将图像转换为铅笔画等等。

将图像转换为铅笔画
在这里插入图片描述

使用词云统计高频词
在这里插入图片描述

将图片转换为灰度图
在这里插入图片描述

"代码解释器"指令已经是一个成熟的AI指令,让用户真正可以用自然语言编程,只需要将意图用‘话’说出来,"代码解释器"就会自动生成Python代码帮你来实现:

将宽度调整为512像素,保持纵横比。模糊度为99像素。将原始图片除以模糊图片,乘以255。应用半径为3,幅度为3的锐化遮罩。转为灰度图像。最后输出图片文件。

在这里插入图片描述

输出词云图,要求支持中文。

在这里插入图片描述

将图片转换为灰度图。

在这里插入图片描述

GPT-4o mini这类高性价比的小模型的出现,更是让"代码解释器"如鱼得水。

"代码解释器"的原理其实很简单,就是AI将你的‘话’作为Prompt来生成代码。当然AI并不一定能一次性生成可用的代码,和吴恩达反思翻译工作流一样,初步生成的代码会被尝试运行,如果发生错误,会把错误信息连同初步生成的代码反馈给AI,让AI找出错误重新生成代码。这个过程往往会重复多次,直到生成的代码正确无误。

因此,AI模型的性价比就变得很重要了。相比一年前,我们可以用十分之一费用来得到相同的效果。

下面一步步来解析"代码解释器"是如何实现的。

第一步,让AI模型判断你的“自然语言”意图是否需要返回文件、图表、图片。Prompt如下:

“”“{codedesc}”“” 上面这个需求是否输出文件或图表或者处理图片?只回答是、否。

{codedesc}变量值就是"代码解释器"的“自然语言”。

第二步,让AI模型根据你的代码要求生成代码。Prompt如下:

“”“{codedesc}”“” 根据上面三重引号内的代码要求{filedesc},编写运行在Windows上的Python
3的程序来满足要求。程序只生成一个文档或图片。文件名为"{fileout}"+后缀,存放在当前目录下。程序最后print这个文件名。不能import
os。不能import shutil。不能import sys。 只需要输出用```包含的代码,绝对不要写其它非代码内容。

“”“{codedesc}”“” 根据上面三重引号内的代码要求{filedesc},编写运行在Windows上的Python
3的程序来满足要求。程序最后print结果文本。不能import os。不能import shutil。不能import
sys。不能写文件。 只需要输出用```包含的代码,绝对不要写其它非代码内容。

{filedesc}变量值就是"代码解释器"的“文件”。

第三步,运行AI模型生成的代码,如果运行错误,返回错误信息。

第四步,根据第三步返回的错误信息,让AI模型检查并修改代码,然后跳回到第三步。Prompt如下:

“”“{pure_code}”“” 上面的代码报错 “”“”{errdesc}“”
请根据错误信息检查一下代码,并返回正确的代码。只输出修正后的代码,绝对不要写其它非代码内容。

第五步,如果第三步运行无误,让AI模型阐述一下生成的代码。Prompt如下:

我的请求: “”“{codedesc}”“” 你的代码: Python {pure_code}
请根据上面的我的请求以及你的代码,为我阐述你是如何实现我的请求的。

通过这样的五个步骤,"代码解释器"的功能就实现了。

Code interpreter代码解释器)是一种将计算机语言转换为可执行代码的软件工具。使用code interpreter可以直接运行和测试编写的代码,而无需进行繁琐的编译过程。 首先,我们需要选择适合自己的code interpreter。常见的code interpreterPython解释器、JavaScript解释器等。根据我们使用的编程语言选择相应的code interpreter。 然后,我们需要将代码输入到code interpreter中。可以使用集成开发环境(IDE)或者命令行进行输入。在IDE中,我们可以创建一个新的代码文件,将代码写入文件中,然后选择运行该文件。在命令行中,将代码输入到相应的编程语言解释器后,按下回车键即可运行代码。 在运行代码之前,我们可以选择设置一些选项。例如,选择运行模式(交互模式或批处理模式),设置文件路径等。这些选项根据不同的code interpreter会有所不同,可以查阅相应的文档或使用帮助命令获得更多信息。 运行代码后,code interpreter会逐行解释代码,并输出结果。我们可以通过观察输出结果来验证我们的代码是否正确。 除了运行代码code interpreter还提供了调试功能。我们可以通过设置断点、单步执行、查看变量的值等方式来帮助我们找出代码中的错误,并进行调试。 总之,使用code interpreter可以方便地运行和测试我们编写的代码,减少了编译的复杂性,提高了代码开发的效率。但需要注意的是,不同的编程语言和不同的code interpreter可能具有不同的操作步骤和设置选项,因此在使用前最好查阅相应的文档或参考相关的教程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值