机器学习
网埠头
大数据分析 人工智能 物联网 区块链 机器学习 智慧农村
展开
-
MOOC学院之Machine Learning学习笔记【第一讲】
【1】机器学习的定义 亚瑟·塞穆尔将机器学习定义为 在没有明确为计算机编写(完成某项具体任务的)原创 2014-11-25 09:19:17 · 765 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【二】Spark shell下kmeans聚类算法的应用
在终端打开spark-shell然后在scala编辑模式下依次输入以下命令://导入算法执行所需函数库import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectors// 加载并分析数据val data = sc.textFile("data原创 2015-03-26 12:07:36 · 2278 阅读 · 0 评论 -
机器学习中的相似性度量标准
在做聚类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯转载 2015-04-08 17:03:33 · 689 阅读 · 0 评论 -
数据挖掘学习笔记--系统聚类法和K均值聚类法
一.系统聚类法 1.基本思想将模式样本按距离准则逐步分类,类别由多到少,直到获得合适的分类要求为止。算法:第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类,。计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为转载 2015-04-09 20:20:00 · 9556 阅读 · 0 评论