机器学习与数据挖掘
我要天天向上
我只是想好好学习天天向上!
展开
-
机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾
作者: 寒小阳 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49797143 1.引言先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)!然后push自己抽出时间来写这篇blog的原因也非常简单:写完前两篇逻辑回归的介绍和各个角度理解之后转载 2016-03-08 15:24:21 · 3558 阅读 · 0 评论 -
机器学习系列(1)_逻辑回归初步
作者:寒小阳 && 龙心尘时间:2015年10月。出处:http://blog.csdn.net/han_xiaoyang/article/details/49123419。1、总述逻辑回归是应用非常广泛的一个分类机器学习算法,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。2、由来 要转载 2016-03-08 16:35:54 · 1120 阅读 · 0 评论 -
机器学习系列(2)_从初等数学视角解读逻辑回归
作者:龙心尘 && 寒小阳 时间:2015年10月。 出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391, http://blog.csdn.net/han_xiaoyang/article/details/49332321。 一、 引言前一篇文章《机器学习系列(1)_逻辑回归初步》中主要介绍了转载 2016-03-08 20:04:29 · 611 阅读 · 0 评论 -
读懂《机器学习实战》代码—K-近邻算法改进约会网站配对效果
从上一篇文章大概了解了K-近邻算法的原理,并实现了分类函数:#inX为用于分类的输入向量 #dataSet为输入的训练样本集 #lables为标签向量 #参数k表示用于选择最近邻居的数目 def classify0(inX,dataSet,lables,k)接下来,通过人物特点将约会者分到不同的类型中,约会数据集格式为第一行表示每年的飞行里程数,第二行表示玩视频原创 2016-03-20 18:38:03 · 3292 阅读 · 4 评论 -
基于 Python 和 Scikit-Learn 的机器学习介绍
R和Python是提供给数据科学家的最常用的两种工具。每一个工具都有其优缺点,但Python最近在各个方面都有所胜出(仅为鄙人愚见,虽然我两者都用)。这一切的发生是因为Scikit-Learn库的腾空出世,它包含有完善的文档和丰富的机器学习算法。请注意,我们将主要在这篇文章中探讨机器学习算法。通常用Pandas包去进行主数据分析会比较好,而且这很容易你自己完成。所以,让我们集中精力在实现上转载 2016-03-09 16:25:19 · 1456 阅读 · 0 评论 -
读懂《机器学习实战》代码—K-近邻算法
一,K近邻算法概念K近邻算法即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。KNN 算法是一种 lazy-learning 算法,分类器不需要使用训练集进行训练,训练时间复杂度为0。KNN 分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中文档总数为原创 2016-03-15 15:26:22 · 2467 阅读 · 1 评论