机器学习
XD_Senior
每天记录一点,每天进步一点。
展开
-
机器学习实战python版第二章示例:手写识别系统
手写识别系统和前面的例子差不多,我们所需要做的就是把图数据转换成一维数组数据:数据准备:def img2vector(filename): returnVect = zeros((1,1024))#创建一行1024列的数组 fr = open(filename) for i in range(32): lineStr = fr.readline()#按行读入数原创 2015-11-21 22:51:58 · 2305 阅读 · 0 评论 -
机器学习实战python版 朴素贝叶斯示例 垃圾邮件分类 从个人广告中获取趋于趋向
首先我们先来看如何使用朴树贝叶斯对电子邮件进行分类准备数据:切分文本对于一个文本字符串,使用python的split()就可以切分文本。>>> mySent = 'this book is the best book on python or M.L. I have even laid eyes upon.'>>> mySent.split()['this', 'book', 'i原创 2015-12-03 20:20:49 · 3171 阅读 · 0 评论 -
机器学习实战python版第四章基于概率论的分类方法 朴素贝叶斯
我们知道让机器给出该数据属于哪一类这样问题明确的答案是有困难的,当有一些误差存在的时候,我们希望机器可以判断属于哪一类的概率更大一些,以此来划分数据。如上图所示,我们有一个数据集,他有两类数据组成,现在有一个新的数据点(x,y),我们需要判别它属于哪个数据集,我们已经学了两种方法:(1)使用第一章的kNN,进行大量的距离计算来判断这个点属于哪一类。(2)使用第二章的决策树,原创 2015-11-30 10:43:35 · 1452 阅读 · 0 评论 -
机器学习实战python版Logistic回归
基于Logistic 回归和Sigmoid函数的分类首先我们要了解Sigmoid函数是什么样的函数,再者这个Logistic回归模型和这个函数的联系。主要内容可以参见李航的《统计学习方法》第六章有详细的讲解,我是看了里面的内容在对应着看机器学习实战中的代码学习的。二项逻辑斯蒂回归主要还是在于确定对应特征的权重,来得到Z= W*X,从而根据模型获得输出分类的Y值。权重的获得是通过梯度原创 2015-12-15 17:28:19 · 1145 阅读 · 0 评论 -
机器学习实战python版决策树以及Matplotlib注解绘制决策树
这一章代码比较难懂,主要是matplotlib的函数调用参数多,调用灵活,让初学者费解。import matplotlib.pyplot as pltdecisionNode = dict(boxstyle="sawtooth", fc="0.8")#boxstyle = "swatooth"意思是注解框的边缘是波浪线型的,fc控制的注解框内的颜色深度leafNode = dict(原创 2015-11-26 14:18:50 · 7830 阅读 · 3 评论 -
机器学习实战python环境搭建以及numpy和matplotlib安装遇到的各种问题(一)
第一次在大神云集的CSDN写博客,以前都是在新浪上随便写一写,当作平时的遇到的一些问题的总结。 自己从这里学到了很多知识,也解决了很多问题。 自学的时候会遇到很多问题,由于没有时间系统的学习知识,都是遇到什么问题就查什么,所以多去动手查资料还是很重要的。 学习的过程就是需要不断的去发现问题,解决问题。再次声明自己也是新手,遇到的一些问题在大牛看来都不值一提,所以在网上也经常找不到解决的办法,其原创 2015-11-18 13:42:33 · 2296 阅读 · 0 评论 -
机器学习实战python版本matplotlib安装遇到的各种问题和代码演示
接着上面的博客写的。 http://blog.csdn.net/xd_senior/article/details/49906023 前一个博客写了python的安装和numpy的安装极应用,还有一些书中代码的演示。接下来写一下我在安装matplotlib中遇到的各种奇葩问题。我的版本是windows64,但是安装的确是win32的版本。 http://sourceforge.net/pro原创 2015-11-19 20:39:49 · 6378 阅读 · 1 评论 -
机器学习实战python版归一化数值和测试kNN算法以及构建完整可用系统
经过前面的学习,我们已经能够较为熟练的应用python而且能够比较轻松的阅读书中的代码。 第一博机器学习实战python环境搭建以及numpy和matplotlib安装遇到的各种问题(一) 第二博机器学习实战python版本matplotlib安装遇到的各种问题和代码演示 学习了几天的机器学习实战,现在已经完全不可收拾了,昨天加班搞完手头的事,今天就迫不及待的打开课本继续欣赏书中算法和代码了原创 2015-11-20 11:23:10 · 1396 阅读 · 1 评论 -
机器学习实战python版第三章决策树代码理解
今天开始学习第三章决策树。前面对决策树的讲解我就不写了,书上写的都很清楚,就是根据特征的不同逐步的对数据进行分类,形状像一个倒立的树。决策树算法比kNN的算法复杂度要低,理解起来也有一定难度。信息增益每一组数据都有自己的熵,数据要整齐,熵越低。也就是说属于同一类的数据熵低,越混合的数据熵越高。计算数据集的熵代码如下:def calcShannonEnt(dataSet):原创 2015-11-21 22:42:28 · 2372 阅读 · 0 评论