机器学习
文章平均质量分 86
zps007
这个作者很懒,什么都没留下…
展开
-
k-近邻算法
k-近邻算法#完整算法def kNNClassify(inX, dataSet, labels, k): dataSetSize = dataSet.shape[0] diffMat = tile(inX, (dataSetSize,1)) - dataSet sqDiffMat = diffMat**2 sqDistances = sqDiffMat.sum(a原创 2017-08-26 17:41:31 · 614 阅读 · 0 评论 -
支持向量机
支持向量机讲道理,这一章有些不敢写。原因:复杂,牵涉到的东西很多,我只是大概看懂。严格的推导过程,推荐看:统计学习方法(李航),该篇借鉴学习了很多线性可分的情况下二类分类的问题,可以考虑如下图:(向量空间图)从上图可以看出其实要分类,俩根虚线和实线都可以大体分出这俩类。现在我们想要最优的分类情况,很自然的想到中间那条实线是不是更好一点?现在就要求得中间那条实线的线性表示。直观上不难看出,要求最优的划原创 2017-08-23 14:22:29 · 303 阅读 · 0 评论 -
机器学习实战读书笔记-Logistic回归
逻辑回归首先说明一下,本人不是学数学的。本篇不会涉及太复杂的公式推导。只是一些朴素的理解,不严谨(我觉得更重要)。特征量有 x1x2...xnx_1 x_2...x_n 这些n个。那么线性回归函数形式: z=z(x)=c0+c1∗x1+c2∗x2+...cn∗xn=0z = z(x) = c_0+c_1*x_1+c_2*x_2+...c_n*x_n = 0 这个可以理解吧。我们现在要求的是该原创 2017-08-18 14:22:31 · 330 阅读 · 0 评论 -
机器学习实战读书笔记-朴素贝叶斯
朴素贝叶斯朴素贝叶斯是一种基于概率论的分类方法条件概率公式P(Y|X)=P(X|Y)P(Y)P(X)P(Y|X) = \frac{P(X|Y)P(Y)}{P(X)}P(Y|X)表示,X条件下Y的概率。举例说明:假设夫妻双方血型,丈夫为O型,妻子为AB型血。两人结合生下的孩子是什么血型? 丈夫血型 妻子血型 孩子的血型 aa AB ?P(A型血|(aa,AB))表示孩子是A原创 2017-08-17 15:38:15 · 399 阅读 · 0 评论 -
机器学习实战读书笔记-决策树
决策树以下是需要的一些子函数# 计算给定数据集的香农熵def calcShannonEnt(dataSet): numEntries = len(dataSet) #得到行数 labeXCounts = {} for featVec in dataSet: currentLabel = featVec[-1] #获取每行最后一列的值 #根据最后原创 2017-08-15 15:53:03 · 379 阅读 · 0 评论