大数据
文章平均质量分 75
Troublemaker201407
这个作者很懒,什么都没留下…
展开
-
决策树算法代码实现及注释(代码来自于机器学习实战)
决策树算法理论思想:代码实现如下:from math import logimport operatordef createDataSet(): dataSet = [[1,1,'yes'],[1,1,'yes'],[1,0,'no'],[0,1,'no'],[0,1,'no']] labels = ['no surfacing','flippers'] return dataSe原创 2017-11-14 16:05:44 · 1622 阅读 · 0 评论 -
KNN算法Python实现(代码来自机器学习实战)及注释
kNN算法是k-近邻算法的简称,主要用来进行分类实践,主要思路如下:1.存在一个训练数据集,每个数据都有对应的标签,也就是说,我们知道样本集中每一数据和他对应的类别。2.当输入一个新数据进行类别或标签判定时,将新数据的每个特征值与训练数据集中的每个数据进行比较,计算其到训练数据集中每个点的距离(下列代码实现使用的是欧式距离)。3.然后提取k个与新数据最接近的训练数据点所对应的标签或类别原创 2017-11-06 15:58:23 · 1140 阅读 · 0 评论 -
Spark升级2.0.1版本安装部署教程
Spark升级2.0.1版本安装部署教程 0.集群当前环境Hadoop版本:2.7.1JDK版本:jdk1.7.0_79Hbase版本:1.1.2Spark版本:1.5.0Scala版本:2.10.41.Spark安装a) 在官网(http://spark.apache.org/downloads.html)上下载与当前hadoop版本适原创 2016-10-17 15:22:40 · 3080 阅读 · 1 评论