NLP相关算法

feifeikon

于 2024-08-16 21:49:05 发布

阅读量378

点赞数 14

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feifeikon/article/details/141270391

版权

一、NLP相关

fasttext的过程？

fastText是一个快速文本分类算法，与基于神经网络的分类算法相比有两大优点：

1、fastText在保持高精度的情况下加快了训练速度和测试速度

2、fastText不需要预训练好的词向量，fastText会自己训练词向量

3、fastText两个重要的优化：Hierarchical Softmax、N-gram

fastText模型架构和word2vec中的CBOW很相似，不同之处是fastText预测标签而CBOW预测的是中间词，即模型架构类似但是模型的任务不同。

基本过程：

● 输入层随机初始化获得词向量

● 隐层对输入向量求平均

● 输出层通过softmax函数分类

word2vec的训练过程？

包括CBOW 与 Skip-Gram两种方法

● CBOW 模型

CBOW 模型（continuous bag-of-word）：根据上下文来预测中心词。

输入为目标单词前后的多个单词（这些单词作为输出的上下文），输出为一个单词。模型结构：

输入层：随机初始化词向量

隐层：输入单词词向量平均求和

输出层：针对整个词表用softmax分类

损失函数：交叉熵

● Skip-Gram：

Skip-Gram 模型是根据一个单词来预测其前后附近的几个单词（即：上下文）。

模型结构：

Skip-Gram 网络的目标是：网络的多个输出之间的联合概率最大

过拟合的表现是什么？如何缓解过拟合的问题？

表现：

对于已知数据（训练集）预测的很好，而对于位置数据预测的很差。训练误差和测试误差之间的差距过大。

缓解：

● 损失函数添加正则化项

● 数据集增强

● 噪声注入：输入噪声、权重噪声、输出噪声注入

● 训练过程早停

LSTM与RNN的区别？介绍一下BiLSTM

LSTM结构更为复杂，在RNN中，将过去的输出和当前的输入concatenate到一起，通过tanh来控制两者的输出，它只考虑最近时刻的状态。在RNN中有两个输入和一个输出。

而LSTM为了能记住长期的状态，在RNN的基础上增加了一路输入和一路输出，增加的这一路就是细胞状态，也就是途中最上面的一条通路。事实上整个LSTM分成了三个部分：

1）哪些细胞状态应该被遗忘

2）哪些新的状态应该被加入

3）根据当前的状态和现在的输入，输出应该是什么

事实上，LSTM就是在RNN的基础上，增加了对过去状态的过滤，从而可以选择哪些状态对当前更有影响，而不是简单的选择最近的状态。

BiLSTM：

前向的LSTM与后向的LSTM结合成BiLSTM。比如，我们对“我爱中国”这句话进行编码，模型如图所示。

介绍一下CRF

CRF是马尔科夫随机场的特例，它假设马尔科夫随机场中只有X和Y两种变量，X一般是给定的，而Y一般是在给定X的条件下的输出。这样马尔科夫随机场就特化成了条件随机场。在我们十个词的句子词性标注的例子中，X是词，Y是词性。因此，如果我们假设它是一个马尔科夫随机场，那么它也就是一个CRF。

对于CRF，给出准确的数学语言描述：设X与Y是随机变量，P(Y|X)是给定X时Y的条件概率分布，若随机变量Y构成的是一个马尔科夫随机场，则称条件概率分布P(Y|X)是条件随机场。

CRF与HMM的主要区别

● HMM是生成模型，CRF是判别模型

● HMM求解过程可能是局部最优，CRF可以全局最优

● CRF是利用最大熵模型的思路去建立条件概率模型，对于观测序列并没有做马尔科夫假设。而HMM是在对观测序列做了马尔科夫假设的前提下建立联合分布的模型。

命名实体识别BiLSTM+CRF模型？为什么用CRF？为什么用BiLSTM？

用CRF：对输出的标签序列之间的状态转移概率进行限制，避免明显错误的标签状态转移发生。

用BiLSTM：将命名实体识别过程中的文本语义特征抽取过程通过神经网络的方式自动化，减少人工干预。

关注

14
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
NLP相关算法

LSTM结构更为复杂，在RNN中，将过去的输出和当前的输入concatenate到一起，通过tanh来控制两者的输出，它只考虑最近时刻的状态。在RNN中有两个输入和一个输出。而LSTM为了能记住长期的状态，在RNN的基础上增加了一路输入和一路输出，增加的这一路就是细胞状态，也就是途中最上面的一条通路。事实上整个LSTM分成了三个部分：1）哪些细胞状态应该被遗忘2）哪些新的状态应该被加入3）根据当前的状态和现在的输入，输出应该是什么。
复制链接

扫一扫

feifeikon CSDN认证博客专家 CSDN认证企业博客

码龄3年

82: 原创

12万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

896: 积分

356: 粉丝

62: 获赞

7: 评论

58: 收藏

私信

关注

热门文章

最新评论

代码随想录 day44 完全背包
看着夕阳敲代码: 博主写的非常好，文章干货满满，三联+关注！欢迎作者闲暇之余能回关我的博客进行指导，谢谢！
代码训练营第二天
CSDN-Ada助手: 非常棒的博客！看到你不断学习和思考的态度，我非常受鼓舞。关于这个题目，我想补充一些相关的知识，比如关于动态规划的思想和技巧，以及如何更好地理解二维矩阵。希望这些能对你的学习和成长有所帮助！继续加油，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
二刷数组总结
CSDN-Ada助手: 恭喜您又写了一篇优秀的博客！通过您的总结，我也学到了很多关于数组的知识。希望您能继续保持创作的热情，为我们带来更多精彩的内容。下一步，建议您可以尝试深入探讨数组在实际应用中的使用，或者结合其他数据结构进行比较分析，让读者更加深入地了解数组的优缺点。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
代码训练营第三天
CSDN-Ada助手: 恭喜您写下了第四篇博客，这样的努力是值得赞赏的。在您的博客中，您描述了代码训练营的第三天，这让读者更好地了解了您的学习进程。在接下来的创作中，我建议您可以尝试分享一些自己的实践经验，或者是对所学知识的一些深入探讨。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
代码训练营第6天
CSDN-Ada助手: 恭喜您完成了代码训练营第6天的学习并分享了您的心得体会。持续不断地创作和分享对于个人的成长和学习来说是非常重要的，希望您能够继续坚持下去。同时，建议您在下一篇博客中可以围绕学习中遇到的问题和解决方案进行探讨和分享，这样能够更好地帮助到其他读者，也能够锻炼自己的表达和思考能力。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。