代码源文件:EmbeddingSimilarityEvaluator.py
文中的相似度测评距离
距离测评公式文章整理
相似度距离测评方法主要有:
余弦距离、曼哈顿距离、欧式距离、dot product
cosine_scores = 1 - (paired_cosine_distances(embeddings1, embeddings2))
manhattan_distances = -paired_manhattan_distances(embeddings1, embeddings2)# 一维范式
euclidean_distances = -paired_euclidean_distances(embeddings1, embeddings2)# 二维范式
dot_products = [np.dot(emb1, emb2) for emb1, emb2 in zip(embeddings1, embeddings2)]
相似度测评方法效果评估
使用了两种相关系数:pearson 相关系数和spearman相关系数
eval_pearson_cosine, _ = pearsonr(labels, cosine_scores)
eval_spearman_cosine, _ = spearmanr(labels, cosine_scores)
1. pearson 相关系数
2.spearman相关系数
原文链接:原文