机器学习解决问题思路 —> 词嵌入矩阵E对于NLP问题的重要性

下面是我对机器学习解决问题的一个理解:
在这里插入图片描述
机器需要做的事:
现象1 —>数据结构1 —> 数据结构2 —> 现象2
1、从现象1—>数据结构1,为了让机器了解是一个什么现象,此过程如果能找到最本质的编码方式将是机器能够成功解决问题的基石,用RGB对图片的编码就是一种非常好的编码。
2、数据结构1—>数据结构2,根据不同的问题可能需要DNN、CNN、RNN等网络结构来找到这种映射关系。这种映射关系是为第3步服务的。
3、数据结构2—>现象2,现象2是针对于你想解决的问题所关注的现象,包含在现象1之中。数据结构2也非常重要,这关乎能否找到合适的Loss function来优化问题,得到映射关系的参数。

对于机器解决问题这3步都至关重要。关于NLP问题的解决,词嵌入矩阵E就相当于此处的数据结构1,但是比我说的最本质的编码要高级一些,这个矩阵会随着拿来训练的语料库变化,语料库会随着时代的变化而变化 。这就是我所说的词嵌入矩阵E对于NLP问题的重要性,有了这个矩阵很多问题只需要很小的训练集也能训练出不错的效果。

对于NLP问题,数据结构1 —>数据结构2这个过程,使用LSTM单元的双向RNN是能解决绝大部分问题,当然对于比较复杂的问题也可以考虑Deep RNNs。
LSTM单元:
在这里插入图片描述
在这里插入图片描述
Bidirection RNN:
在这里插入图片描述

Deep RNN:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值