Embedding层

最新推荐文章于 2024-04-24 17:29:50 发布

qq1123703939

最新推荐文章于 2024-04-24 17:29:50 发布

阅读量115

点赞数

分类专栏： pytorch学习代码

本文链接：https://blog.csdn.net/qq1123703939/article/details/100653175

版权

pytorch学习代码专栏收录该内容

7 篇文章 0 订阅

订阅专栏

one-hot编码的概念。

如：我从哪里来要到何处去 ——>>>[0 1 2 3 4 5 6 7 8 9]

或：我从何处来要到哪里去 ——>>>[0 1 7 8 4 5 6 2 3 9]

我从哪里来，要到何处去

[
[1 0 0 0 0 0 0 0 0 0]
[0 1 0 0 0 0 0 0 0 0]
[0 0 1 0 0 0 0 0 0 0]
[0 0 0 1 0 0 0 0 0 0]
[0 0 0 0 1 0 0 0 0 0]
[0 0 0 0 0 1 0 0 0 0]
[0 0 0 0 0 0 1 0 0 0]
[0 0 0 0 0 0 0 1 0 0]
[0 0 0 0 0 0 0 0 1 0]
[0 0 0 0 0 0 0 0 0 1]
]

我从何处来，要到哪里去

[
[1 0 0 0 0 0 0 0 0 0]
[0 1 0 0 0 0 0 0 0 0]
[0 0 0 0 0 0 0 1 0 0]
[0 0 0 0 0 0 0 0 1 0]
[0 0 0 0 1 0 0 0 0 0]
[0 0 0 0 0 1 0 0 0 0]
[0 0 0 0 0 0 1 0 0 0]
[0 0 1 0 0 0 0 0 0 0]
[0 0 0 1 0 0 0 0 0 0]
[0 0 0 0 0 0 0 0 0 1]

计算的方法与所需的字数矩阵相乘就行了。但是one—hot有一个缺点，就是占内存

所以引入Embedding：

也许你已经想到了！！！对！！！不管你想的对不对，但是embedding层，在某种程度上，就是用来降维的，降维的原理就是矩阵乘法。可以将这个矩阵映射到过渡矩阵在卷积网络中，可以理解为特殊全连接层操作，跟1x1卷积核异曲同工！！

####当然也可以升维。为什么要升维？
就像找不同，在10M处逐渐到1MM处找不同，视野之类的都不同。

这就是卷积层和池化层的道理：回想一下为什么CNN层数越深准确率越高，卷积层卷了又卷，池化层池了又升，升了又降，全连接层连了又连。因为我们也不知道它什么时候突然就学到了某个有用特征。但是不管怎样，学习都是好事，所以让机器多卷一卷，多连一连，反正错了多少我会用交叉熵告诉你，怎么做才是对的我会用梯度下降算法告诉你，只要给你时间，你迟早会学懂。因此，理论上，只要层数深，只要参数足够，NN能拟合任何特征。

版权声明：本文为CSDN博主「罗大黑」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_42078618/article/details/82999906