数据挖掘
jinyuhang521
这个作者很懒,什么都没留下…
展开
-
K-均值算法
K均值算法 一、概念: 形式地,给定n个数据对象的数据集D,以及主要生成的簇数k,划分算法 把数据对象组织成k(k 二、分析: 1、基于距离 给定分区k 2、准则:同一个簇中对象尽可能相近,不同簇中的对象尽可能远离。 3、技术:迭代重定位 组的切换 局部最优解 4、应用场景:中小规模的数据库中的球状簇。 三、算法:原创 2015-11-05 23:37:33 · 477 阅读 · 0 评论 -
scikit-learn环境搭建
其实关于scikit-learn的安装,官方文档上提供了三种安装方式, 1、根据你自己的操作系统已经安装的Python,选择相应的scikit-learn版本进行安装。 2、安装官方正式发布版本,主要针对想要稳定版本的用户。 3、安装最新的开发版本,主要针对想拥有更多更新的功能的用户。 这里介绍一下安装稳定版的方式: 安装scikit-learn之前,你需要安装Python(>=原创 2015-10-14 23:10:11 · 657 阅读 · 0 评论