Deep Learning for Nature Language Processing --- 第四讲（下）

最新推荐文章于 2017-06-13 09:17:46 发布

Xiaomin-Wu

最新推荐文章于 2017-06-13 09:17:46 发布

阅读量1.6k

点赞数

分类专栏： NLP 文章标签：自然语言处理

NLP 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

A note on matrix implementations

将J对softmax的权重W和每个word vector进行求导：

这里写图片描述

尽量使用矩阵运算（向量化），不要使用for loop。

模型训练中有两个开销比较大的运算：矩阵乘法f=Wx和指数函数exp

for loop

Softmax(=logistic regression) is not very powerful

softmax只是在原来的向量空间中给出了一些linear decision boundary（线性决策线），在小的数据集上有很好的regularization，但是在处理大数据集的时候会受到很大的限制。

这里写图片描述

但是neural network能够很好地克服softmax的缺点：

这里写图片描述

From logistic regression to neural nets

不单独介绍神经网络，可以参考其他介绍神经网络的文章

如果没有非线性的激活函数，那么输入x后，第一层就是W1x，第二层就是W2W1x，等同于这个神经网络只有一层，权重为W2W1。

有更多的层，deep learning就可以有近似（分类）更复杂数据集的功能：

这里写图片描述

神经网络的单层single layer就是一个线性表达式和一个非线性函数的组合：

这里写图片描述

激励activation可以用来计算某个函数，例如在softmax中：

这里写图片描述

示例：计算三层神经网络中一个window’ score（s=score(museumsinParisareamazing)）：

这里写图片描述
score其实就是softmax的概率值

下一讲

训练一个window-based的神经网络

反向传播backpropagation

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Deep Learning for Nature Language Processing --- 第四讲（下）

A note on matrix implementations将J对softmax的权重W和每个word vector进行求导：尽量使用矩阵运算（向量化），不要使用for loop。模型训练中有两个开销比较大的运算：矩阵乘法f=Wx和指数函数expSoftmax(=logistic regression) is not very powerfulsoftmax只是在原来的向量空间中给出了一些lin
复制链接

扫一扫

专栏目录

Xiaomin-Wu CSDN认证博客专家 CSDN认证企业博客

码龄10年

46: 原创

18万+: 周排名

58万+: 总排名

25万+: 访问

: 等级

2521: 积分

76: 粉丝

33: 获赞

27: 评论

78: 收藏

私信

关注

热门文章

分类专栏

Android 应用 1篇
Java 3篇
git 4篇
Android底层 3篇
ubuntu 2篇
ML 26篇
python 2篇
ML比赛 3篇
NLP 10篇
papers 13篇
深度学习框架 1篇
搬砖 5篇

最新评论

PRelu--Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
Xupt_小玉: 博主您好，这篇文章的数据集和完整源码能提供一下吗，邮箱[email protected]，万分感谢！！！
PRelu--Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
LR110: 你好，请问你知道Prelu相比relu效果怎么样吗？
PRelu--Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
躺鸡小能手: 博主您好，有一个问题想咨询您！对于三维图像，取其中一个图像块（27*27*27），卷积核大小为3*3*3，共20个卷积核，在这种情况下，请问nl的值是多少？论文中提到：nl代表到该层中的单元的连接的数量，我自己的理解是：需要滑动25*25*25次，所以总的连接数为25*25*25*3*3*3*20
DeepLearning--Part3--Chapter16:Representation Learning(1) categories:
wuliytTaotao: Representation Learning不是第15章吗？
DL4NLP---第三讲
呵呵的校园: 请教一下，这个U(w)是什么分布？和Z是什么意思？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。