机器学习
文章平均质量分 71
NEU_SML
知行合一,守正出奇,与人为善,天道酬勤!
展开
-
机器学习中分类和聚类的区别
机器学习中分类和聚类的区别在机器学习中有两种常见的任务:分类(Classification)和聚类(Clustering)。 在初学机器学习时,对这两个概念的理解容易混淆,随着学习的深入,对这两个概念有了基本的认识,现总结如下:1.分类: 属于监督学习的范畴,根据一些给定的已知类别的样本,使它能够对未知类别的样本进行分类,要求必须事先明确知道各个类别的信息。2.聚类: 属...原创 2018-08-05 15:39:58 · 3557 阅读 · 0 评论 -
K-means算法详解
目录什么是K-means算法?如何寻找K值和质心?K-means算法流程1.什么是K-meansK-Means是一种聚类算法,其中K表示类别数,Means表示均值。K-means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分,并通过划分后的均值迭代优化获得最优的聚类结果。K-means算法以欧式距离作为相似度测度。2.如何寻找K值和质心K值就是...原创 2018-08-19 17:10:29 · 7752 阅读 · 0 评论 -
对向量和矩阵范数的总结
1.范数的意义(norm)数学中的映射表达的就是一个集合通过某种关系转为另外一个集合,为了更好的在数学上表达这种映射关系,(这里特指线性关系)于是就引进了矩阵,所谓映射就是一个集合(向量),通过一种映射关系(矩阵),得到另外一个集合(另外一个向量)。 那么向量的范数,就是表示这个原有集合的大小。 而矩阵的范数,就是表示这个变化过程的大小的一个度量。 总结起来一句话,范数(norm),...原创 2018-08-22 21:22:21 · 768 阅读 · 0 评论 -
AUC(Area under curve 即Roc曲线下面积)总结
1.Roc曲线Roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的敏感性。横轴:负正率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例纵轴:真正类率(true postive rate TPR)灵敏度,敏感度(正类覆盖率)2.二分类问题针对一个二分类问题...原创 2018-08-23 21:48:43 · 8645 阅读 · 0 评论 -
ALS(Alternating Least Squares)
ALS(Alternating Least Squares)算法是基于矩阵分解的协同过滤算法中的一种,它已经集成到Spark的Mllib库中,使用起来比较方便。1.矩阵分解这里的矩阵分解可以理解为,将一个m×n的矩阵A分解为一个m×k的矩阵U和n×k的矩阵V的转置的乘积的近似值,即Am×n≈Um×k×VTn×kAm×n≈Um×k×Vn×kTA_{m×n}≈U_{m×k}×V_{n×k}...原创 2018-08-24 09:05:02 · 5100 阅读 · 0 评论 -
矩阵的特征分解证明
特征分解的证明A=Vdiag(λ⃗)V−1A=Vdiag(λ→)V−1A=Vdiag(\vec \lambda)V^{-1}原创 2018-09-06 16:07:54 · 4341 阅读 · 0 评论 -
奇异值分解(singular value decomposition)
1.奇异值分解(SVD)奇异值分解是将矩阵分解为奇异向量和奇异值,通过奇异值分解,我们会得到一些与特征分解相同类型的信息。然而,奇异值分解有更广泛的应用,每个实数矩阵都有一个奇异值分解,但不一定都有特征分解。非方阵的矩阵没有特征分解,这时我们只能使用奇异值分解。2.分解方法奇异值分解将矩阵A分解成三个矩阵的乘积:A=UDVTA=UDVTA = UDV^{T}其中,A是一...原创 2018-09-06 18:58:28 · 1075 阅读 · 0 评论 -
数据的中心化和标准化处理
1.意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。 注解: 单位具有实际的物理意义,而量纲则不一定。比如说焦耳,表示能量,具有实际物理意义就是单位(同时也是量纲),而很多单位的组合都不能表示确切的物理意义,比如说m·s(米乘以秒),这种就是量纲,这个的用处只是为了考察某些物理公式是否具有相同量纲从而确定其正确性。 2.原理 数据中心化:是指变...原创 2018-09-16 19:08:37 · 19253 阅读 · 1 评论 -
WARNING (theano.tensor.blas): Using NumPy C-API based implementation for BLAS functions.
安装thenao时出现WARNING (theano.tensor.blas): Using NumPy C-API based implementation for BLAS functions.应该怎么解决1.使用cmd安装类库conda install mkl conda install mkl-servic conda install blas2.在如下位置添加...原创 2018-08-18 17:53:21 · 7779 阅读 · 12 评论