MachineLearning
Damen2016
这个作者很懒,什么都没留下…
展开
-
MachineLearning Practice: decision tree
1.K-NN算法可以完成很多分类任务,但是其中的一个较大的缺点是其无法给出数据的内在含义,决策树能在数据形式上能对数据产生很好的解读。决策树能够挖掘数据中蕴含的信息,因此决策树可以应用于不熟悉的数据集,从中提取一系列的规则,而这个过程也是机器学习的过程。2.构建决策树时,如果该数据集的分类还不是同一类,计算该数据集的信息熵和不同特征条件下的信息熵,选择信息增益(information gain)最大原创 2016-01-16 20:30:21 · 431 阅读 · 0 评论 -
MachineLearning Practice:K-NN
1.存在一个样本数据集,作为样本数据集,该样本集的每一条数据都存在标签也就是说每条样本集的类别已知。输入一个没有标签的新数据集,将新数据的特征和样本集的数据特征进行比较,然后提取与新数据最相似的样本数据的标签作为新数据的标签。一般来说,选择样本集中前K个出现次数最多的标签作为新数据的标签。2.一般步骤:收集数据(文本/其他程序收集)–>准备数据(归一化,格式化数据,是数据使用于距离计算)–>分析数据原创 2016-01-11 21:36:34 · 432 阅读 · 0 评论 -
MachineLearning Practice: Adaboost
from numpy import *def loadSimpData(): datMat = matrix([[ 1. , 2.1], [ 2. , 1.1], [ 1.3, 1. ], [ 1. , 1. ], [ 2. , 1. ]]) classLabels = [1.0, 1.0, -1.0, -1.原创 2016-01-29 10:49:07 · 642 阅读 · 0 评论 -
MachineLearning Practice: linear regression
00'''Created on Jan 8, 2011@author: Peter'''from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t'原创 2016-01-31 17:56:32 · 427 阅读 · 0 评论 -
MachineLearning Practice: CART
regTrees.pyfrom numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats dataMat = [] #assume last column is target value fr = open(fileName原创 2016-01-31 18:04:02 · 535 阅读 · 0 评论