机器学习
Scrat000
这个作者很懒,什么都没留下…
展开
-
Kmeans、Kmeans++和KNN
原文地址:https://blog.csdn.net/chlele0105/article/details/12997391K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用圆点表示...转载 2018-05-20 16:42:09 · 388 阅读 · 0 评论 -
sklearn.model_selection.KFold
https://blog.csdn.net/kancy110/article/details/74910185/转载 2018-07-04 13:01:06 · 681 阅读 · 0 评论 -
pandas的drop()中axis取值简便记忆法
一直对drop中axis的取值与其代表的含义感到疑惑,网上有很多文章对axis取0或1时,删除方向进行过解释,大多都侧重于具体删除时的执行方向,今天玩代码突然发现,drop里axis取0或1其实是……df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["a", "b", "c", "d"])>>...原创 2018-06-30 11:50:21 · 14072 阅读 · 6 评论 -
主成分分析PCA-降维的必要性-协方差矩阵-特征值-特征向量
原文来自:博客园(华夏35度)http://www.cnblogs.com/zhangchaoyang 作者:Orisun降维的必要性1.多重共线性--预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。2.高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有0.02%。3.过多的变量会妨碍查找规律的建立。4.仅在变量层面上分析可能会忽...转载 2018-05-23 11:04:20 · 2243 阅读 · 0 评论 -
二元分类效果的评估方法
原文地址:https://blog.csdn.net/quliulangle/article/details/76577020效果评估是模型选择和算法设计的重要步骤,知道评估优劣才能选择最佳的模型和算法,本节介绍一些有关评估方法的定义,凡是在统计或大数据领域都用得到 真阳性true positives, TP真阴性true negatives, TN假阳性false positives, FP假阴...转载 2018-05-21 16:31:05 · 879 阅读 · 0 评论 -
线性回归与逻辑回归
原文地址:https://blog.csdn.net/ppn029012/article/details/8775597机器学习可以解决很多问题,其中最为重要的两个是 回归与分类。 这两个问题怎么解决, 它们之间又有什么区别呢? 以下举几个简单的例子,以给大家一个概念1. 线性回归回归分析常用于分析两个变量X和Y 之间的关系。 比如 X=房子大小 和 Y=房价 之间的关系, X=(公园人流量,公园...转载 2018-05-21 16:24:56 · 1008 阅读 · 0 评论