CBOW与Skip-Gram

本文深入探讨了CBOW和Skip-Gram两种神经网络语言模型,这两种模型用于训练词嵌入矩阵,实现词汇的高效表示。CBOW通过上下文预测目标词,而Skip-Gram则是预测目标词的上下文。通过这两个模型,可以将独热编码压缩为低维的embedding矩阵,提高计算效率,并用于各种自然语言处理任务。在训练过程中,使用softmax最大化真实单词的概率,优化损失函数,以提升模型性能。
摘要由CSDN通过智能技术生成

CBOW与Skip-Gram

两个训练任务,过程中产生VxD的矩阵,可以用于将独热编码压缩缩短,得到的矩阵叫embedding矩阵。

CBOW

这里写图片描述

根据矩阵的维度思考:第一个是VxN,用于实现维度压缩;第二个是NxV为了得到这个位置上是语料库中任意一个单词的概率,通过softmax 最大化groundtruth(真实单词)的概率,反向传播训练得到矩阵。

参考

Skip-Gram

新知达人, 【图文并茂】通过实例理解word2vec之Skip-gram

新知达人, 【图文并茂】通过实例理解word2vec之Skip-gram

中间同样实现降维,降维后再输出到V维度上概率,表示该位置单词成为这个单词上下文的概率。

第一个仍然是降维矩阵,第二个是为了得到概率的矩阵,然后最终的损失函数是这个单词的上下文的单词的概率最大。

新知达人, 【图文并茂】通过实例理解word2vec之Skip-gram

参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值