NLP模型大对比：Transformer ＞Seq2Seq ＞ LSTM ＞ RNN ＞ n-gram

feifeikon

已于 2025-01-31 01:54:31 修改

阅读量1.4k

点赞数 20

文章标签：自然语言处理 transformer bert

于 2025-01-28 19:52:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feifeikon/article/details/145388614

版权

结论

Transformer 大于传统的Seq2Seq 大于 LSTM 大于 RNN 大于传统的n-gram

n-gram VS Transformer

我们可以用一个 图书馆查询 的类比来解释它们的差异：

一、核心差异对比

维度	n-gram 模型	Transformer
工作方式	固定窗口的"近视观察员"	全局关联的"侦探"
依赖距离	只能看前N-1个词（如3-gram只看前2词）	可关注任意距离的上下文
语义理解	机械统计共现频率	理解词语间的深层关系
典型场景	"牛奶要配_" → "饼干"（高频搭配）	"牛奶要配_" → "燕麦"（健康概念关联）

二、具体差异拆解

1. 观察范围限制

n-gram 像用 望远镜片段观察
例：处理句子 "虽然价格贵但质量真的好"
- 3-gram只能看到局部组合：
  ["价格_贵_但", "贵_但_质量", "但_质量_真"]
- 无法关联首尾的 "价格" 和 "质量" 的对比关系
Transformer 像用 全景扫描仪
通过自注意力机制，让每个词都能关注到句子中所有其他词：
```
# "质量"对"价格"的注意力权重可能高达0.7
# "但"对"虽然"的注意力权重可能达0.6
```

2. 语义关联能力

n-gram 的局限性案例
输入： "苹果股价大涨，因为新品很甜"
- 3-gram会错误关联："新品_很_甜" → 可能预测"西瓜"（高频搭配）
- 无法发现 "苹果" 在此处指公司而非水果

Transformer 的解决方案
通过上下文注意力权重识别语义：

"苹果" ← 关注到 "股价" (权重0.8) → 判定为企业  
"甜"   ← 关注到 "新品" (权重0.3) + "股价" (权重0.6) → 判定为比喻用法

最低0.47元/天解锁文章

博客等级

码龄4年

163
原创

1514
点赞

1330
收藏

1165
粉丝

关注

私信

热门文章

最新评论

代码训练营第二天
CSDN-Ada助手: 非常棒的博客！看到你不断学习和思考的态度，我非常受鼓舞。关于这个题目，我想补充一些相关的知识，比如关于动态规划的思想和技巧，以及如何更好地理解二维矩阵。希望这些能对你的学习和成长有所帮助！继续加油，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
二刷数组总结
CSDN-Ada助手: 恭喜您又写了一篇优秀的博客！通过您的总结，我也学到了很多关于数组的知识。希望您能继续保持创作的热情，为我们带来更多精彩的内容。下一步，建议您可以尝试深入探讨数组在实际应用中的使用，或者结合其他数据结构进行比较分析，让读者更加深入地了解数组的优缺点。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
代码训练营第三天
CSDN-Ada助手: 恭喜您写下了第四篇博客，这样的努力是值得赞赏的。在您的博客中，您描述了代码训练营的第三天，这让读者更好地了解了您的学习进程。在接下来的创作中，我建议您可以尝试分享一些自己的实践经验，或者是对所学知识的一些深入探讨。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
代码训练营第6天
CSDN-Ada助手: 恭喜您完成了代码训练营第6天的学习并分享了您的心得体会。持续不断地创作和分享对于个人的成长和学习来说是非常重要的，希望您能够继续坚持下去。同时，建议您在下一篇博客中可以围绕学习中遇到的问题和解决方案进行探讨和分享，这样能够更好地帮助到其他读者，也能够锻炼自己的表达和思考能力。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
day7 代码训练营主要是哈希表和双指针法和几数之和问题
CSDN-Ada助手: 非常棒的博客！恭喜你完成了代码训练营的第七天任务，并成功掌握了哈希表和双指针法以及几数之和问题。你的学习态度值得我们学习和借鉴。接下来，我建议你可以继续深入了解这些算法的应用场景和优化方法，这样能够更好地提高你的编程技能。期待你的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

大家在看

最新文章

2025

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。