【Token系列】14｜Prompt不是文本，是token结构工程

最新推荐文章于 2025-05-03 23:30:11 发布

Sumy[Tea构建者]

最新推荐文章于 2025-05-03 23:30:11 发布

阅读量938

点赞数 14

分类专栏： AI智能文章标签：深度学习机器学习语言模型自然语言处理人工智能

本文链接：https://blog.csdn.net/qingdaoyin/article/details/147640613

版权

22 篇文章

订阅专栏

14｜Prompt不是文本，是token结构工程

副标题：理解Prompt写法，先理解它如何被切分成token和影响Attention结构

语言模型不会“按人类的语义”理解Prompt，而是按其被切分成的token结构来处理。

例子：

Prompt A: 请你给我写一个优美的诗句。
Prompt B: 帮我写诗。

你觉得A更有礼貌，但模型可能：

token结构密度 = 在有限token中，信息是否集中、分布是否便于模型识别

例子：

① “你能否帮我生成一个关于春天的句子？”  
② “生成：春天 句子”

Transformer中的Self-Attention结构如下：

attention(Q, K, V) = softmax(QK^T / √d) * V

如果Prompt写法导致：

→ 这些都直接干扰模型的注意焦点。

你输入了100个token，不代表信息量高。例子：

A: “请问你能否为我推荐一些在春天适合阅读的书籍？”
B: “推荐：春天 读书”

→ 模型看到的有效token：
- A中“你能否”“适合”拆成多个token，句式冗余；
- B中核心token“推荐”“春天”“读书”高密度排列 → 更有效；

场景	优化策略
复杂指令	拆分为结构清晰的token块，如“目标：”“范围：”
信息稀释	删除客套与冗语，如“你能不能帮我…”，“请问…”
多轮对话	用标记提示结构变化，如“历史对话：”“当前任务：”
控制生成结果	使用明确指令token，如“格式为：”“使用markdown”

用tokenizer工具查看token化结果

示例：
输入：“你能不能帮我推荐一本书”
→ token列表：[“你”, “能”, “不”, “能”, “帮”, “我”, “推”, “荐”, “一”, “本”, “书”]
→ 说明部分词被拆分，结构松散，可优化为：“推荐一本书”
检查高信息词是否被切断

示例：
“Transformer模型如何工作” → 若“Transformer”被拆成多token，建议拼写统一（如用“transformer”英文）
检查是否用过多低信息词填充Prompt空间

示例：
“请问你可不可以帮我完成一项简单的小小的工作？”
→ 可压缩为：“完成一项任务”
控制总token数，让高密度token尽可能靠后

示例：
将“以下是背景信息…”提前，将任务问题压到Prompt结尾，以避免截断影响回答质量。
优化关键词顺序，让Q能高效与K建立attention连接

示例：
不推荐：“你在上文中说过……” → 模型找不到“上文”；
推荐：“请解释以下内容：‘你上次提到的观点是……’” → 提示结构更稳定，关键词更集中。