原因就是你没找到合适的教程。如果这篇你看不明白,关了,下一篇。
embedding层有什么用
首先,embedding是为了处理文字的理解。让机器能够理解一句话的意思: 灰白灰会挥发。一句话,6个字。
但是只有五种 白,灰,会,挥,发。
编码
我们需要将汉字表达成网络认识的数字,比如我用整数表达。
白:2
灰:1
会:3
挥:4
发:5
句子就可以写成121345。
我用3维的01向量也能表达
白:(000)
灰:(001)
会:(010)
挥:(100)
发:(111)
成吧?相应的这句话就是(001)(000)(001)(010)(100)(111)就能表示灰白灰会挥发了。就是比起121345的表示方法长了好些。
我再费劲点,我用one hot编码方式
白:(10000)
灰:(01000)
会:(00100)
挥:(00010)
发:(00001)
也可以吧?
那么看来,我有很多种能够对字编码的方式。那我能不能找到一种最有优势的。比方说,如