牙周炎先生-CSDN博客

原创皮尔森与斯皮尔曼相关系数：原理、步骤与公式解析

本文系统介绍了两种常用相关系数的原理与应用。皮尔森相关系数适用于衡量线性关系，要求数据接近正态分布；斯皮尔曼秩相关系数则适用于单调关系，对数据分布无要求且更抗异常值干扰。文章通过身高体重、复习时间与成绩等生活案例，详细讲解了两者的计算步骤与公式含义，并提供了直观的对比表格。建议数据分析时先绘制散点图观察关系形态，根据数据特征选择合适的相关系数，同时强调相关不等于因果。掌握这两种相关系数能帮助新手更准确分析变量间关系。

2025-12-22 17:36:34 799

原创马氏距离：超越欧氏距离的智能距离度量

马氏距离是一种考虑数据相关性和尺度差异的距离度量方法，由印度统计学家马哈拉诺比斯于1936年提出。与欧氏距离相比，它能消除不同特征的量纲差异，并通过协方差矩阵的逆矩阵调整特征权重和相关性。马氏距离的计算步骤包括确定均值向量、计算协方差矩阵及其逆矩阵，最终通过矩阵运算得到距离值。该方法特别适用于多维数据分析，在异常检测、分类任务和聚类分析等场景中表现优异。使用时需注意协方差矩阵的可逆性，确保样本数量大于特征数量且特征间不完全共线。随着数据科学的发展，马氏距离在深度学习、金融风控等领域的应用前景广阔。

2025-12-22 17:32:40 931

温一多

原创皮尔森与斯皮尔曼相关系数：原理、步骤与公式解析

原创马氏距离：超越欧氏距离的智能距离度量

原创协方差（covariance）与相关系数（correlation）：数据关系的量化语言

原创余弦相似度算法：方向决定相似性

原创基于价格型相似度算法（绝对差值法、相对比例法、归一化法、多维度加权法、余弦相似度、欧氏距离、皮尔逊相关系数和DTW算法）分析对比

原创欧氏距离相似算法：两点之间的直线距离

原创曼哈顿距离相似算法：从城市街道到数据空间

原创 Jaccard算法及其扩展(token、加权)原理详解

原创 Monge-Elkan算法是一种高效的字符串相似度计算方法

原创 Soft TF-IDF算法与传统TF-IDF的区别

原创破除机器学习中的过拟合问题

原创 Jaro相似度算法解析：原理、步骤与公式详解

原创 Jaro-Winkler距离算法详解：从拼写纠错到相似度计算

原创 Levenshtein距离算法详解：从简单例子到完整知识体系

原创基于TF-IDF的相似度算法原理：从基础到应用

原创分类与回归树(CART)生成匹配规则原理

原创基于Q-Grams的文本相似度算法：从日常例子到数学公式

原创基于Jaccard相似度算法原理：从日常例子到数学公式

原创基于Canopy聚类的分块方法：从生活化例子到数学公式

空空如也

空空如也