对于一句话, “我, 很, 帅”, 编码,如果用 one-hot编码,会产生一个稀疏矩阵,并且随着句子规模的扩大,会造成很大的空间资源浪费。同时,“帅” 和“酷”是一对同义词,他们是存在着某种相关性的,而One-hot编码不能体现出两者的相关,故Embedding横空出世
Embedding原理也很简单,就是对one-hot进行降维,也就是密集矩阵到稀疏矩阵的转化
对于一句话, “我, 很, 帅”, 编码,如果用 one-hot编码,会产生一个稀疏矩阵,并且随着句子规模的扩大,会造成很大的空间资源浪费。同时,“帅” 和“酷”是一对同义词,他们是存在着某种相关性的,而One-hot编码不能体现出两者的相关,故Embedding横空出世
Embedding原理也很简单,就是对one-hot进行降维,也就是密集矩阵到稀疏矩阵的转化