ML算法实现
Bingmous
世界很大,我很渺小
展开
-
决策树CART回归树——算法实现
决策树模型选择最好的特征和特征的值进行数据集划分 根据上面获得的结果创建决策树 根据测试数据进行剪枝(默认没有数据的树分支被剪掉) 对输入进行预测模型树import numpy as npdef loadDataSet(fileName): #general function to parse tab -delimited floats dataMa...原创 2019-11-15 16:46:47 · 229 阅读 · 0 评论 -
决策树——算法实现
分类树,特征的值和类标签都是离散值计算熵,选择最优分类特征 对分类后的各个子集再进行计算熵,选择最优分类特征 停止条件:分类后的所有数据集都属于同一类;没有可分的特征,选择数量最多的类作为预测类;import numpy as npimport mathimport operatordef createDataSet(): dataSet = [[1, 1, 'yes...原创 2019-11-14 18:17:04 · 128 阅读 · 0 评论 -
朴素贝叶斯——算法实现
朴素贝叶斯通常用于特征的范围是离散的,即每个特征可取值的范围是离散的。给定训练集、标签,计算训练集中每个类标签的概率,再计算每个类标签下每个特征的概率。给出带预测样本的特征,计算每个类标签下的概率,选择最大的类标签作为预测类。通常可以使用贝叶斯估计防止某个概率为0,即对于每个特征的概率分子分母都加上一项lambda,Sj*lambda,使用log函数避免概率太小而没什么区别。过滤留言板恶意...原创 2019-11-12 12:44:31 · 277 阅读 · 0 评论 -
k-NN——算法实现
k-NN 没有特别的训练过程,给定训练集,标签,k,计算待预测特征到训练集的所有距离,选取前k个距离最小的训练集,k个中标签最多的为预测标签约会类型分类、手写数字识别分类计算输入数据到每一个训练数据的距离 选择前k个,判断其中类别最多的类作为预测类import numpy as npimport operatorimport matplotlibimport matplotli...原创 2019-11-09 20:09:53 · 223 阅读 · 0 评论