机器学习
文章平均质量分 90
碧空之戈
这个作者很懒,什么都没留下…
展开
-
决策树原理详解
决策树是机器学习中一种基本的分类和回归算法,是依托于策略抉择而建立起来的树。其主要优点是模型具有可读性,分类速度快,易于理解。决策树的思想主要来源于Quinlan在1986年提出的ID3算法和1993年提出的C4.5算法,以及有Breiman等人在1984年提出的CART算法。1.什么是决策树决策树简单来说就是带有判决规则(if-then)的一种树,可以依据树中的判决规则来预测未知样本的类...转载 2018-10-03 12:13:27 · 34526 阅读 · 1 评论 -
决策树调参说明(DecisionTreeClassifier)
sklearn中决策树算法参数共有13个,如下: class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_fea...原创 2018-10-03 14:21:26 · 27666 阅读 · 5 评论 -
正则化公式以及L1正则化产生稀疏阵的原因
范数的公式 范数是衡量某个向量空间(或矩阵)中的每个向量以长度或大小。范数的一般化定义:对实数p>=1, 范数定义如下:L1范数当p=1时,是L1范数,其表示某个向量中所有元素绝对值的和。L2范数当p=2时,是L2范数, 表示某个向量中所有元素平方和再开根, 也就是欧几里得距离公式。 实际应用与选择 下面以sklearn里逻辑回归算法为例,具体看下两者的不同...原创 2018-10-04 11:09:00 · 5153 阅读 · 1 评论 -
数据预处理--sklearn preprocessing模块的使用
本文主要介绍sklearn preprocessing四个数据预处理的函数,大概分两类,一是标准化,二是将将数据特征缩放至某一范围。这四个函数都在sklearn preprocessing模块中,无论哪个方法,都是对列进行的操作。一、标准化标准化适用的情况:如果有些特征的方差过大,则会主导目标函数从而使参数估计器无法正确地去学习其他特征,这个时候需要数据标准化,分两步,一是去均值的中心化...原创 2018-10-10 10:39:21 · 10260 阅读 · 0 评论