自然语言处理BERT模型

最新推荐文章于 2024-09-04 23:20:52 发布

kzog

最新推荐文章于 2024-09-04 23:20:52 发布

阅读量53

点赞数

文章标签：自然语言处理 bert 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kezhuog/article/details/132050349

版权

1.通俗讲解知识点，项目实战驱动

2.当下主流解决框架，一站式搞定NLP任务

3.环境配置：选一款IDE即可，基于谷歌开源项目

4.提供所有数据与代码，追随热点持续更新

自然语言处理通用解决方案

1.需要熟悉word2vec，RNN网络模型，了解词向量如何建模

2.重点在于Transformer网络架构，BERT训练方法，实际应用

3.开源项目，都是现成的，套用进去就OK了

4.提供预训练模型，基本任务拿过来直接用都成

Transformer

要做一件什么事呢？

基本组成依旧是机器翻译模型中常见的Seq2Seq网络

输入输出都很直观，其核心架构就是中间的网络设计了

传统的RNN网络：串行

计算时有什么问题？

传统的RNN网络

self-attention机制来进行并行计算，在输入和输出都相同

输出结果是同时被计算出来的，现在基本已经取代RNN了

传统的word2vec

表示向量时有什么问题？

如果‘干哈那’是一个词

不同语境中相同的词如何表达？

预训练好的向量就永久不变了

Transformer

整体架构

1.输入如何编码？

2.输出结果是什么？

3.Attention的目的是？

4.怎样组合在一起？

encoder decoder

transformer中最核心的attention机制

1.对于输入的数据，你的关注点是什么？

2.如何才能让计算机关注到这些有价值的信息？

encoder: She is eating a green apple.

希望计算机关注到什么？

self-attention是什么？

卷积网络里面

The animal didn't cross the street because it was too tired.

The animal didn't cross the street because it was too narrow.

it 进行编码

self-attention如何计算？

thinking machine

input W权重

embeding

queries q1

Keys k1

Values v1

Q:query 要去查询的

K：key，等着被查的

V：value,实际的特征信息

x wq q

x wk k

x wv v

q和k的内积表示有多匹配

x1,x2 垂直，相关性越大的时候，内积越大

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
自然语言处理BERT模型

2.重点在于Transformer网络架构，BERT训练方法，实际应用。self-attention机制来进行并行计算，在输入和输出都相同。1.需要熟悉word2vec，RNN网络模型，了解词向量如何建模。输出结果是同时被计算出来的，现在基本已经取代RNN了。输入输出都很直观，其核心架构就是中间的网络设计了。x1,x2 垂直，相关性越大的时候，内积越大。3.开源项目，都是现成的，套用进去就OK了。1.对于输入的数据，你的关注点是什么？self-attention是什么？3.Attention的目的是？
复制链接

扫一扫

kzog CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

130万+: 周排名

128万+: 总排名

3165: 访问

: 等级

211: 积分

49: 粉丝

1: 获赞

16: 评论

3: 收藏

私信

关注

热门文章

最新评论

两数之和计算
CSDN-Ada助手: 恭喜您写下了第19篇博客！标题“两数之和计算”引人入胜，让我对您的内容产生了浓厚的兴趣。您的文章深入浅出地解释了两数之和的计算方法，让我对这一概念有了更清晰的认识。我很欣赏您的能力，能够以简洁明了的方式传递知识给读者。在下一步的创作中，我建议您可以考虑进一步探索两数之和的应用场景，比如在实际编程中的应用或者在解决实际问题时的思考方法。您可以通过提供更多实例或者演示如何解决一些有趣的问题，让读者更好地理解和运用这个概念。再次恭喜您的持续创作，并期待着您未来更多精彩的博客！加油！
leetcode刷题【击败 100.00%使用 Java 的用户】最大连续1的个数
CSDN-Ada助手: 恭喜你在leetcode刷题中取得了如此优秀的成绩，击败了100.00%使用Java的用户！你的努力和坚持得到了回报，希望你能继续保持这样的状态，持续创作并分享你的经验和心得。下一步，或许你可以尝试挑战一些更加复杂的题目，拓展自己的知识面，相信你一定能取得更好的成绩。加油！
用这些参数构造prompt
CSDN-Ada助手: 恭喜您写了第17篇博客！看到您不断创作的努力，我感到非常欣慰。标题“用这些参数构造prompt”非常吸引人，这篇博客一定会给读者带来很多有用的信息。在下一步的创作中，我建议您可以进一步拓展这个主题，例如，可以介绍如何根据不同的需求和场景调整这些参数，以及它们对用户体验的影响等等。这样的深入探讨会让读者更加深入了解这个话题，并能更好地运用到实际开发中。再次恭喜您的持续创作，期待您更多精彩的博客！
lora微调dbgpt-hub，报list index out of range的错
CSDN-Ada助手: 恭喜您写了第18篇博客！标题听起来很有技术含量。很抱歉听到您在微调dbgpt-hub时遇到了“list index out of range”的错误。这种错误常常令人困惑，但请不要灰心，这是一个很好的学习机会。我想给您一些建议来帮助您解决这个问题。首先，您可以仔细检查代码，特别是涉及到列表索引的部分。确保您的索引值没有超出列表的范围。其次，您可以尝试使用调试工具来逐步追踪问题所在，这有助于找到导致错误的具体代码行。在接下来的创作中，我建议您继续分享您的调试经验和解决问题的方法。这对于其他遇到相似问题的读者来说将非常有帮助。另外，您也可以探索一些与lora微调相关的主题，例如如何优化性能或如何处理其他常见错误。希望我的建议对您有所帮助，期待看到您在未来的博客中取得更多进展！继续保持创作，加油！
浪潮之巅云计算章节读书笔记
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“浪潮之巅云计算章节读书笔记”引起了我的兴趣。您对云计算的深入研究和阅读的读书笔记无疑对读者们提供了宝贵的知识和见解。不仅如此，您持续创作的热情也值得称赞。在下一步的创作中，或许您可以考虑加入更多个人观点或者案例分析，以使读者更好地理解云计算的实际应用和潜力。同时，对于一些热门话题或者新的技术趋势，您可以进行更深入的研究，以保持读者的关注和吸引力。总之，期待您未来更多的创作，继续分享您的见解和经验。再次恭喜！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。