深度学习基础之四

这篇博客介绍了深度学习的基础知识,特别是神经网络结构。网络有一个隐藏层和一个输出层,输入是8维向量,隐藏层无激活函数,输出层使用softmax确保输出为概率分布。隐藏层神经元数量决定了词向量的维度,训练完成后,保存隐藏层权重矩阵作为词向量。输出层的神经元数量与词汇表大小相同,通过softmax转换为概率分布,表示单词出现的概率。
摘要由CSDN通过智能技术生成

定义网络结构

总结上文神经网络:

1) 神经网络的输入应该是8维的向量   2) 神经网络只有一个隐藏层 3) 神经网络的输出应该是一个8维向量,且各维的值相加为1

  • 有了这些,可以很容易定义出如下的网络结构:

  • s3它的隐藏层并没有激活函数,但是输出层却用了softmax,这是为了保证输出的向量是一个概率分布。

  • 隐藏层

    输出层的神经元应该是8个,这样才能输出一个8维的向量。那么隐藏层的神经元应该是多少?


    这取决于我们希望得到的词向量是多少维,有多少个 隐藏神经元 词向量就是多少维。每一个隐藏的神经元接收的输入都是一个8维向量,假设我们的隐藏神经元有3个(实际中,google推荐的是300个,怎么效果好怎么定),如此以来,隐藏层的权重就可以用一个8行3列的矩阵来表示。

    网络训练完成后,这个8行3列的矩阵的每一行就是一个单词的词向量!

  • s4

  • 训练完成后,只需要保存  隐藏层的 权重矩阵 ,输出层此时已经完成使命,可以丢掉了。

    那么怎么使用去掉了输出层的网络呢?
     网络的输入是one-hot编码的单词&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值