深度学习基础之四

最新推荐文章于 2023-11-28 15:15:02 发布

casanava18

最新推荐文章于 2023-11-28 15:15:02 发布

阅读量206

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/casanava18/article/details/100897878

版权

这篇博客介绍了深度学习的基础知识，特别是神经网络结构。网络有一个隐藏层和一个输出层，输入是8维向量，隐藏层无激活函数，输出层使用softmax确保输出为概率分布。隐藏层神经元数量决定了词向量的维度，训练完成后，保存隐藏层权重矩阵作为词向量。输出层的神经元数量与词汇表大小相同，通过softmax转换为概率分布，表示单词出现的概率。

摘要由CSDN通过智能技术生成

定义网络结构

总结上文神经网络：

1) 神经网络的输入应该是8维的向量 2) 神经网络只有一个隐藏层 3) 神经网络的输出应该是一个8维向量，且各维的值相加为1

有了这些，可以很容易定义出如下的网络结构：
它的隐藏层并没有激活函数，但是输出层却用了softmax，这是为了保证输出的向量是一个概率分布。
隐藏层

输出层的神经元应该是8个，这样才能输出一个8维的向量。那么隐藏层的神经元应该是多少？

这取决于我们希望得到的词向量是多少维，有多少个隐藏神经元词向量就是多少维。每一个隐藏的神经元接收的输入都是一个8维向量，假设我们的隐藏神经元有3个（实际中，google推荐的是300个，怎么效果好怎么定），如此以来，隐藏层的权重就可以用一个8行3列的矩阵来表示。

网络训练完成后，这个8行3列的矩阵的每一行就是一个单词的词向量！
训练完成后，只需要保存隐藏层的权重矩阵 ,输出层此时已经完成使命，可以丢掉了。

那么怎么使用去掉了输出层的网络呢？
网络的输入是one-hot编码的单词&#x

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础之四

定义网络结构总结上文神经网络：1) 神经网络的输入应该是8维的向量 2) 神经网络只有一个隐藏层 3)神经网络的输出应该是一个8维向量，且各维的值相加为1 有了这些，可以很容易定义出如下的网络结构：它的隐藏层并没有激活函数，但是输出层却用了softmax，这是为了保证输出的向量是一个概率分布。隐藏层输出层的神经元应该是8个，这样才能输出一个8维的向...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。