大数据
米汤馒头
这个作者很懒,什么都没留下…
展开
-
决策树 (decision tree)
先贴上代码,以后有时间了,再来补内容 1.本次代码采用的是信息增益的方法(entropy) from sklearn.feature_extraction import DictVectorizer import csv from sklearn import preprocessing from sklearn import tree from sklearn.externals.si...原创 2018-12-14 02:18:41 · 153 阅读 · 0 评论 -
KNN算法
KNN算法,是比较常见而且也易于实现的机械学习分类算法。其从字面上简单的可以理解为,周围离预测点最近的K各点中大多数点的属性就为预测点的属性。此处,可以看出这样三个关键点。第一,少数服从多数;第二,知道周围点的属性,因此需要储存属性,这点便导致了KNN算法需要比较大的空间复杂度;第三,最近的K各点。如何判断最近?便以此,引入距离的概念。距离在解析几何中定义(空间两点或者两向量之间的距离) , 线...原创 2018-12-16 07:27:26 · 252 阅读 · 0 评论