机器学习实战
文章平均质量分 84
hechenghai
已经不走技术路线了,可能没法回到大家的问题了,抱歉!
展开
-
机器学习实战之 决策树——ID3算法
机器学习实战之 决策树——ID3算法决策树的含义所谓决策树,顾名思义,是一种树,一种依托于策略抉择而建立起来的树。机器学习中,决策树是一个预测模型;它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的是某个可能的属性值,而每个叶子节点则对应根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理原创 2015-08-30 21:58:47 · 3008 阅读 · 0 评论 -
机器学习实战之KNN算法
一、KNN算法分析k最近邻(KNN)分类算法应该是机器学习分类算法中最简单的算法了,它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类策略上只依据最近邻的一个或者多个样本的类别来决定待分类样本所属的类别。由于原创 2015-08-17 22:48:09 · 703 阅读 · 0 评论 -
机器学习实战之朴素贝叶斯
4. 朴素贝叶斯的优缺点:优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型数据。5.使用Python进行文本分类5.1 准备数据:从文本中构建词向量 我们将把文本看成单词向量或者词条向量。考虑出现在所有文档中的所有单词,再决定将哪些词纳入词汇表或者说所要的词汇集合,所以必须将每一篇文档转化成词汇表上的向原创 2015-09-06 23:08:37 · 867 阅读 · 0 评论 -
机器学习实战之 Logistic算法
Logistic 回归1.基本步骤Logistic回归:实际上属于判别分析,因拥有很差的判别效率而不常使用。逻辑回归的一般过程1) 收集数据:采用任意方法收集数据。2) 准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。3) 分析数据:采用任意方法对数据进行分析。4) 训练算法:原创 2015-11-01 22:40:10 · 992 阅读 · 0 评论 -
Mahout线性回归算法源码分析(1)--实战
转载地址:http://blog.csdn.net/fansy1990/article/details/23766523版本:mahout0.9Mahout里面使用逻辑回归(logistic regression)的主要两个类是org.apache.mahout.classifier.sgd.TrainLogistic、org.apache.mahout.cla转载 2015-12-25 11:36:13 · 1764 阅读 · 0 评论