认识一下，提示词工程学的前世今生

数据科学和人工智能兴趣组

于 2024-08-24 22:51:25 发布

阅读量335

点赞数 16

分类专栏：（免费）人工智能应用文章标签： r语言 RStudio 人工智能深度学习人工智能作画人工智能写作

本文链接：https://blog.csdn.net/2301_79425796/article/details/141506696

版权

（免费）人工智能应用专栏收录该内容

15 篇文章 2 订阅

订阅专栏

人工智能（Artificial intelligence，AI）的演进已然变革了我们对于技术的理解以及应用方式。自最初的规则系统直至当下的深度学习，AI 在众多领域均彰显出了极为巨大的潜力。当中，生成式预训练模型（Generative Pre-trained Transformer，GPT）属于近些年来引发广泛瞩目的技术之一。并且基于这些技术，人工智能生成内容（AI-Generated Content, AIGC）获得了广泛的运用。而提词工程学（Prompt Engineering）作为与 AIGC 紧密相连的新兴范畴，也逐步吸引了人们的关注。

一、GPT的发展历程

GPT的核心是Transformer架构，它由Vaswani等人在2017年提出。Transformer通过自注意力机制（Self-Attention）来捕捉序列中各个位置之间的关系。相比传统的循环神经网络（RNN）和卷积神经网络（CNN），Transformer在处理长序列时效率更高，性能更好。GPT采用预训练-微调（Pre-training and Fine-tuning）的策略。在预训练阶段，模型在大规模未标注数据上进行训练，学习语言的基本结构和规律。微调阶段，模型在特定任务的数据集上进行调整，使其适应具体的应用场景。这个策略使得GPT能够在不同任务上表现出色。

2018年，OpenAI发布了GPT-1，这是第一个基于Transformer的生成预训练变换器模型。2019年，OpenAI推出了GPT-2，这一版本在参数量上有了显著的提升，从GPT-1的1.17亿参数增加到15亿参数。2020年，OpenAI发布了GPT-3，它的参数量达到了1750亿，是GPT-2的十倍多。

2023年，OpenAI发布了GPT-4，进一步提升了模型的能力和性能。GPT-4不仅在参数量上有所增加，还在处理复杂语言任务、理解上下文、生成连贯文本等方面表现出色。2024年，OpenAI推出的“GPT-4o mini”迷你AI模型和SearchGPT原型，都是其致力于在“多模态”领域保持领先地位的一部分。所谓“多模态”，即在一个工具内部，提供多种类型的AI生成媒体，包括文本、图像、音频、视频以及搜索功能。

........

欢迎订阅我们专栏，深度系统地学习R语言。

为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用，由于众多同学在计算机编程上经验欠缺，特此开设《用R 探索医药数据科学》专栏。该专栏每周至少会定期更新三篇，直到整个专栏更新完成。每篇文章都在 5000 字以上，质量平均分高达 94 分。还要提醒大家的是，每结束一个章节，专栏的优惠力度就会减小，当下正是订阅的最佳优惠时段，诚邀各位积极订阅！

专栏《用R 探索医药数据科学》链接：https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482

........

二、GPT时代的AIGC

AIGC（AI-generated Content）即由人工智能所生成的内容，涵盖的范畴包括但不限于文本、图像、音频以及视频等等。AIGC 技术的关键核心在于生成模型，例如 GPT 之类，其凭借对大量数据的学习从而生成高品质的内容。AIGC 的问世，给内容创作带来了全新的可能性以及挑战。

我们应当了解，AIGC 的发展历程能够追溯至 20 世纪 60 年代，彼时约瑟夫·魏岑鲍姆（Joseph Weizenbaum）研发出了 ELIZA，这属于早期的自然语言处理程序，其旨在模拟人类之间的对话。ELIZA 能够借助简单的模式匹配技术和用户展开互动，尽管功能存在一定的局限性，然而它却彰显出计算机生成类人交互的潜力。不过，伴随 OpenAI 的 GPT 系列的推出，这意味着 AIGC 迈入了一个至关重要的里程碑阶段。由于 GPT 模型运用了 Transformer 架构，经过大量数据的预训练，能够生成连贯且与上下文紧密相关的文本，极为逼真地效仿人类的写作风格。不管是新闻报道、市场营销的相关内容，还是社交媒体的帖子，AI 均能够迅速生成高质量的文本内容。举例来说，GPT-3 被广泛运用于生成新闻文章、博客内容以及技术文档等等。这些成效都是以往的技术所无法达成的！

三、AIGC 的发展催生了提示词工程学

随着 ChatGPT 的问世和发展，一批以年轻人为主的群体开始热衷于探索大型语言模型和图像生成程序，尝试让它们执行其开发者未曾预料甚至未曾设想的任务。然而，在这个过程中，也面临着诸多技术难题和伦理争议。很多创新公司可以雇佣具有对人工智能模型命令设计和优化的人士，因为他们可以通过设计复杂的提示词来发现模型的特点来来完成工作任务。但是，要找到真正精通此道的人才并非易事，且相关成本也较高。

所以，一门这样的技术就出现了！提示词工程学（Prompt Engineering）是指通过设计和优化输入提示词，来引导人工智能模型生成期望的输出。这一过程涉及对模型行为的精细控制，以达到特定的目标或解决实际问题。提示词工程学不仅包括简单的文字输入，还可能涉及到复杂的语言结构和上下文设置。

提示词工程学的关键技术包括提示词设计、模型调整和自动化提示词生成。提示词设计是基础，常见策略有示例驱动、格式化提示和上下文设置，分别通过提供示例、特定格式和背景信息帮助模型理解任务。模型调整是提升性能的重要手段，包含模型微调以提高特定任务适应性、参数调整优化性能、多轮对话提升输出质量。随着发展，自动化生成提示词技术逐渐成熟，涵盖遗传算法、强化学习和自动化工具，分别能自动生成和优化提示词、依据反馈优化、简化设计优化流程。

伴随着各类 AIGC 模型不断增多，技术在多维度上的进步以及应用范围的拓展，提示词工程学必将发挥愈发关键的作用，为各行各业赋予崭新的机遇与挑战。期望本文能够为您带来关于提示词工程学的初步认知。

数据科学和人工智能兴趣组

关注

16
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
认识一下，提示词工程学的前世今生

人工智能（Artificial intelligence，AI）的演进已然变革了我们对于技术的理解以及应用方式。自最初的规则系统直至当下的深度学习，AI 在众多领域均彰显出了极为巨大的潜力。当中，生成式预训练模型（Generative Pre-trained Transformer，GPT）属于近些年来引发广泛瞩目的技术之一。
复制链接

扫一扫