数据挖掘
文章平均质量分 66
david_hnu
雁过留痕
展开
-
机器学习入门方法前言
作为一名机器学习的新手,突然有个大胆的决定,开始写博客。主要目的是当做自己学习算法以及代码之后的总结,督促自己弄清算法条理和其中的数学推理,其次想记录一下自己学习过程中的心路历程。从入门到精通并不容易,光学书本知识或者听课只能让自己会用,从应用到创新的过程需要不断的总结反思,因此我将借助CSDN这个平台来帮助我反思、进步。当然,如果仅此而已的话写在日记本上就好,但我觉得写在这里将会增加和各...原创 2018-06-17 11:32:07 · 254 阅读 · 1 评论 -
决策树算法实现(以ID3为例)
决策树之训练过程在于建树,树结构的建立过程是递归的,关键步骤是选择属性进行划分数据集,选择划分的策略引出了各种版本决策树,ID3、C4.5和CART,其中前两种基于信息论,CART采用GINI系数对属性进行划分。编写决策树之前首先需要明确决策树的结构特点: 1、叶子节点是样本(用这类样本计算标签值,回归树用这个单元中的样本计算输出值,然后联合多个单元中的输出值和权重计算总的回归值) 2、非叶节...原创 2018-11-20 12:57:07 · 1391 阅读 · 0 评论