在GPT模型进入到4.0时代之后,语言模型的逻辑判断和处理能力都得到了显著的提高。Claude 2.1以及百度文心一言4等模型在逻辑判断上都持续发力,逻辑判断方面基本达到实用的层面。特别是跟用户的语言交互结合,加上不错的逻辑判断能力,也为我们的程序开发提供了一种新的可能。
任何开发语言中,逻辑处理都是其中非常核心的内容,大量的if, else, switch, case已经融入到了编程的呼吸中,平时甚至已经不会可以感受到了。但是一些复杂场景的逻辑处理也在挑战我们的脑力,和测试小伙伴的耐性。
借助AI语言大模型的接口,和提示词工程(Prompt Engineering)我们对这个问题可以有一个新的解法。使用AI语言模型API接口,借助大模型的逻辑判断能力来简化甚至提高编程的逻辑处理能力。
我们可以借助几个例子来具体看一下效果。
例子一: 目标像素目标选择
场景描述:在使用stable xl模型进行图片处理时对于原图像像素有限定,仅能支持1024x1024, 1152x896, 1216x832, 1344x768, 1536x640, 640x1536, 768x1344, 832x1216, 896x1152这些像素的图片,所以我们需要对图片进行预处理,找到满足要求的像素目标。
在我们的常规处理中,可能会通过原始图片的长宽逐级匹配找到能够匹配上的长宽组合,或者进一步通过匹配总像素,然后找到最近的对应长宽组合。不论哪种一方方法都会涉及到一大堆的逻辑判断(附送一大堆bug)。
下面我们来看一下通过调用AI大模型接口如果优雅的解决这个问题。
我们这里使用的提示词函数如下:
def get_image_dimensions_for_stable_xl_template(width, height):
template = f"""
The image original width is: '{width}', height is: '{height}', which is {width}x{height} for short, the required image dimensions