场景描述
本章的主题是模型评估,但其实在模型训练过程中,我们也在不断地评估着样本间的距离,如何评估样本距离也是定义优化目标和训练方法的基础。在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之问的相似性时,常使用余弦相似度来表示。余弦相似度的取值范围是 [-1,11,相同的两个向量之间的相似度为 1。如果希望得到类似于距离的表示,将1减去余弦相似度即为余弦距离因此,余弦距离的取值范围为[0,2],相同的两个向量余弦距离为 0。
知识点:余弦相似度、余弦距离、欧氏距离、距离的定义
问题一 :结合你的学习和研究经历,探讨为什么在一些场景中要使用余弦相似度而不是欧式距离?
难度:★★☆☆☆
对于两个向量A和B,其余弦相似度定义为