机器学习实战
文章平均质量分 93
mmい
这个作者很懒,什么都没留下…
展开
-
决策树
前言:本系列文章旨在熟悉算法的同时增强编程能力,使用的都是很小的数据集,代码是自己一点点码出来的,如有错误还望指正,O(∩_∩)O谢谢数据集这是一个非常著名的隐形眼镜的数据集,总共有四个属性{age, prescript, astigmatic, tearRate},最后一个是列标签{hard:硬材质,soft:软材质,no lenses:不适合佩戴}。很显然这个数据集是让我们根据各个属性来分类原创 2017-04-17 21:33:10 · 629 阅读 · 0 评论 -
k-近邻
一个简单的例子关于k近邻算法的理论我就不多说了,直接上一个非常简单快速的实现:下面这个是分类函数,输入参数: 待分类样本testX训练集dataSet训练样本标签dataSetk值在这段代码中,距离计算、k个邻居的求解以及最后投票的规则我都使用函数给出,是因为这三个值可以用不同的方法得到。比如距离计算可以使用欧氏距离、曼哈顿距离、皮尔逊相关系数等等;k个邻居可以是前k个邻居,也可以是以0原创 2017-04-15 15:33:03 · 507 阅读 · 0 评论 -
朴素贝叶斯
数据集sourceData 是一些文本数据,labels是对应的列标签。这是一个网站的评论信息,希望通过朴素贝叶斯分类器来过滤掉比较负面的评论,0表示正常评论,1表示负面评论。可以简单的看到第二个数据中出现了stupid酱紫骂人的语句,那么这是一条负面评论的概率很大。sourceData = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'p原创 2017-04-18 18:58:42 · 664 阅读 · 0 评论 -
Logistic回归
写在前头,平日里自以为对逻辑回归的理论推导什么的了解很透彻,核心思想也就是一个梯度下降算法而已,实现起来却花了我一整天,具体困扰我的是对于各种矩阵操作的不熟悉以及对于代码结构的设计不当造成的;下面详细展开我的实现啦,多练多练才能真正理清算法的真正漏洞<( ̄ˇ ̄)/读取数据集因为逻辑回归中有大量的矩阵运算,因此我将返回的数据类型设置为矩阵np.mat,当然你也可以使用np.array;但是arra原创 2017-04-20 21:31:20 · 977 阅读 · 0 评论