主要用于文本分析
“I love you”
整数编码
深度学习的输入都要转换为数字,这里我们可以把"I"映射为0,"love"映射为1,"you"映射为2,这样
"I love you"既可以编码为[0,1,2]
One-Hot编码
整数编码不好的地方是1,2,3之间默认有距离,比如"you"距离"I"为2,距离"love"为1,而现实他们都是独立的,就是相互的距离应该都是1,所以就需要One hot编码了.
将"I"映射为[1,0,0],"love"映射为[0,1,0],"you"映射为[0,0,1],这样
"I love you"可以编码为
[[1,0,0],
[0,1,0],
[0,0,1]]