机器学习
文章平均质量分 89
wf592523813
这个作者很懒,什么都没留下…
展开
-
决策树python实现(ID3 和 C4.5)
决策树概论决策树是根据训练数据集,按属性跟类型,构建一棵树形结构。一棵决策树包含一个根节点、若干内部节点和若干叶节点。叶节点对应于决策结果,其他每个节点则对应于一个属性测试;每个节点包含的样本集合根据属性测试的结果被划分到子节点中;根节点包含样本全集。从根节点到每个叶节点的路径对应了一个判定测试序列。决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,遵循‘分而治之’的策略。...原创 2018-10-10 21:36:48 · 1746 阅读 · 0 评论 -
K折交叉验证与网格搜索算法(scikit learn)
K折交叉验证过程:选择K的值(一般是10),将数据集分成不重叠的K等份 。使用其中的K-1份数据作为训练数据,另外一份数据作为测试数据,进行模型的训练使用一种度量测度来衡量模型的预测性能优点:可通过降低模型在一次数据分割中性能表现上的方差来保证模型性能的稳定性可用于进行参数调节、模型性能比较、特征选择等缺点:交叉验证带来一定的计算代价, 是当数据集很大的时候,计算过程会变得...原创 2019-01-12 16:16:15 · 5741 阅读 · 4 评论 -
机器学习实战之adaboost(附python3代码)
利用AdaBoost元算法提高分类性能元算法(meta-algorithm)或者集成方法(ensemble method)是对其他算法进行组合的一种方式AdaBoost算法优点:范化错误率低,易编码,可以应用在大部分分类器上,无参数调整缺点:对离群点敏感适用数据类型: 数值型和标称型数据bagging和boosting所使用的多个分类器类型都是一致的!bagging: 基于数据随机抽...原创 2019-01-08 17:31:01 · 3062 阅读 · 3 评论 -
机器学习实战之树回归(CART)python实现(附python3代码)
树回归CART(Classification And Regression Tree, 分类回归树)完整代码见github环境 python3决策树分类决策树不断将数据切分成小数据集,直到所有的目标变量完全相同,或者数据不能再切分为止。决策树是一种贪心算法,它要在给定的时间内做出最佳选择,但不关心是否达到全局最优。ID3的做法是每次选取当前最佳的特征来分割数据,并按照该特征的所有取值...原创 2019-01-09 12:13:52 · 4749 阅读 · 1 评论 -
scikit learn各个常用模型调参总结
SVM对数据进行归一化 (simple scaling)使用RBF kernel使用cross_validation 和 grid_search得到最佳参数gamma和C使用得到的最优C和gamma训练训练数据测试svm的CC是惩罚系数,即对误差的宽容度。一般可以选择为:10^t , t=[- 4,4]就是0.0001 到10000。c越高,说明越不能容忍出现误差,容易过拟合。C...原创 2019-01-16 11:29:54 · 7277 阅读 · 2 评论 -
Pandas之read_csv()读取文件跳过报错行
pandas读取文件(read_csv),跳过报错的行读取文件时遇到和列数不对应的行,此时会报错。若报错行可以忽略,则添加以下参数:样式:pandas.read_csv(***,error_bad_lines=False)pandas.read_csv(filePath) 方法来读取csv文件时,可能会出现这种错误:ParserError:Error tokenizing data.C e...原创 2019-04-16 19:39:12 · 16131 阅读 · 0 评论 -
pandas学习笔记
异常值检测和过滤使用 describe() 函数查看每一列的描述性统计count 列的元素的个数mean 平均值std 标准方差,描述数据的波动,离散程度min 最小max 最大数据小于标准方差的四倍,认为数据是有意义的DataFrame.info()这个函数可以输出读入表格的一些具体信息。这对于加快数据预处理非常有帮助。独热编码实现方法比较1、pandas自带的get_du...原创 2019-04-15 22:52:59 · 364 阅读 · 0 评论 -
机器学习中数据的属性类型
关于数据的属性类别的介绍数据集由数据对象组成,一个数据对象代表一个实体。数据对象又称样本、实例、数据点或对象。属性(attribute)是一个数据字段,表示数据对象的一个特征。属性向量(或特征向量)是用来描述一个给定对象的一组属性。属性有不同类型:标称属性(nominal attribute)、二元属性(binary attribute)、序数属性(ordinal attribute)、 数值属...原创 2019-04-15 11:45:46 · 6428 阅读 · 0 评论 -
Keras中的回调函数Callbacks详解
介绍回调函数是一组在训练的特定阶段被调用的函数集,你可以使用回调函数来观察训练过程中网络内部的状态和统计信息。通过传递回调函数列表到模型的.fit()中,即可在给定的训练阶段调用该函数集中的函数。虽然我们称之为回调“函数”,但事实上Keras的回调函数是一个类keras.callbacks.Callback()是回调函数的抽象类,定义新的回调函数必须继承自该类类属性params:...原创 2019-07-07 21:28:58 · 28556 阅读 · 1 评论