机器学习
文章平均质量分 80
Eaton18
这个作者很懒,什么都没留下…
展开
-
K均值(K-Means)聚类算法简介
K均值算法K均值算法是一个经典的,被广泛使用的聚类算法。算法过程K均值算法中首先选择K个初值。K是用户指定的参数,即希望聚成的簇的个数。每个点指派到最近的质心,指派到一个质心的点集为一个簇。然后更新每个簇的质心,直到簇不发生变化,或质心不发生变化(二者等价),结束算法。算法: K均值算法--------------------选择K个点作为初始质心。 (STEP 1)repeat 将每个点指派到最近的质心,形成K个簇。 (STEP 2) 重新计算每个簇的质心。 (STEP原创 2021-03-30 07:57:24 · 6912 阅读 · 0 评论 -
常见距离的度量及python实现
目录闵可夫斯基距离(Minkowski Distance)堪培拉距离(Canberra Distance)余弦距离(Cosine Distance)汉明距离(Hamming Distance)简单匹配距离(Simple Matching Distance)杰卡德距离(Jaccard Distance)Note闵可夫斯基距离(Minkowski Distance)Minkowski Distance不是一种距离,而是一组距离。两个n维变量A(a1,a2,…,an)与B(b1,b2,…,bn)间的闵可夫斯基原创 2021-03-27 10:45:55 · 1706 阅读 · 0 评论 -
ADJUSTED BOXPLOT: 偏态分布的异常检测
Boxplot是一个常用的了解数据分布的工具,在数据预处理阶段也常用boxplot剔除离群点,但是当数据是一个偏态分布的时候,boxplot将许多点误分类为离群点。《AN ADJUSTED BOXPLOT FOR SKEWEDDISTRIBUTIONS》是一篇经典的修正boxplot在偏态分布数据上的误报问题的文章。1. 传统boxplot方法对于一组数据Xn={x1,x2,x3,...,xn}X_n=\{x_1,x_2,x_3,...,x_n\}Xn={x1,x2,x3,...,xn},计原创 2020-06-01 23:42:06 · 3603 阅读 · 7 评论 -
时间序列之间的相关性检测
为了检测时间序列的相关性,我们经常使用自相关,互相关或归一化互相关。互相关(Cross-Correlation)互相关是两个不同时间序列的比较,以检测具有相同最大值和最小值的指标之间是否存在相关性。例如:“两个音频信号同相吗?”为了检测两个信号之间的相关程度,我们使用互相关。 只需将两个时间序列相乘和相加即可计算得出。在以下示例中,序列A和B是互相关的,但序列C都不与此相关。a = [...原创 2019-11-18 00:56:53 · 22514 阅读 · 5 评论 -
深入理解协方差
协方差协方差矩阵协方差和相关系数协方差的意义原创 2019-11-16 20:53:25 · 2172 阅读 · 0 评论 -
统计量MAD
MAD(Median absolute deviation, 中位数绝对偏差)是单变量数据集中样本差异性的稳健度量。mad是一个健壮的统计量,对于数据集中异常值的处理比标准差更具有弹性,可以大大减少异常值对于数据集的影响。原创 2017-04-20 10:34:37 · 14305 阅读 · 0 评论 -
PCA数学原理
PCA(主成分分析)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。转载 2016-10-09 16:08:31 · 537 阅读 · 0 评论 -
连续属性离散化
离散化技术分类连续属性的离散化方法也可以被称为分箱法,即将一组连续的值根据一定的规则分别放到其术语的集合中。 本文介绍了几种监督离散化和非监督离散化的方法。原创 2016-08-07 17:17:07 · 12354 阅读 · 0 评论 -
决策树学习笔记
决策树是依托于决策一步步建立起来的树形数据模型。 本文主要讲解了建立决策树时的节点分裂、剪枝等问题。原创 2016-08-06 22:14:11 · 1574 阅读 · 0 评论 -
时间序列分析.基本数学概念
本文主要介绍时间序列分析中会用到的一些数学知识。原创 2016-06-26 19:15:49 · 2377 阅读 · 0 评论 -
是什么阻碍了你的机器学习目标?
我收到过许多想开始学习机器学习的开发者和学生的邮件。我问他们的第一个问题是:是什么阻止了你开始学习?我试图找出让他们挣扎的核心原因,大多数时候都是一些自我限制的想法在阻止他们前进。这篇文章里我想谈谈一些在我和学生的邮件来往和讨论中发现的一些自我限制的想法。也许在这些想法里面你也会发现自己的影子。如果这样的话,我希望你能挑战自己的这些设想。自我限制的想法自我限制的想法转载 2015-04-22 14:13:08 · 628 阅读 · 0 评论