这是我在B站看"攻城狮之家"视频所记下的笔记,感觉自己按照思路写一遍比看一遍心里踏实的多。
在介绍这个概念之前,我们先提出一个思考问题,如何判断以下三个词的相似度?
“我们、爬山、运动,昨天”
使用One-hot表示法表示每个词,如下:
我们={0,1,0,0,0,0}
爬山={0,0,1,0,0,0}
运动={1,0,0,0,0,0}
昨天={0,0,0,0,0,1}
如果使用欧式距离法计算不同词的距离:
d(我们,爬山)=√2
d(我们,运动)= √2
d(我们,昨天)= √2
d(爬山,运动)= √2
d(爬山,昨天)= √2
d(运动,昨天)= √2
∴d(我们,爬山) = d(我们,运动) = d(我们&#x