- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 机器学习:GBDT和XGBoost的区别
一、GBDT原理 1、简介 GBDT是一个基于迭代累加的决策树算法,它通过构造一组弱的学习器(树),并把多颗决策树的结果累加起来作为最终的预测输出。 他的核心就是累加所有树的结果最为最终结果(但实际上并不是简单的叠加),GBDT中的树都是回归树,构建每棵树的时候,我们会对特征和样本同时采样(引用RF思想) 2、公式推导 3、优缺点 优点:非线性变换多,表达能力强,而且不需要做复杂的特征工
2017-06-26 19:40:25 699
原创 机器学习:决策树算法
1.算法引入 先举一个简单的例子来介绍一下决策树到底是个什么东西。(参考:) 一个母亲要给女儿介绍对象,所以有了如下的对话: 女儿:多大年纪了? 女儿:多大年纪了? 母亲:26。 女儿:长的帅不帅? 母亲:挺帅的。 女儿:收入高不? 母亲:不算很高,中等情况。 女儿:是公务员不? 母亲:是,在税务局上班呢。 女儿:那好,我去见见。 这个女孩的判断过程就是一个决策树,她根据
2017-06-24 18:34:44 495
原创 XGBoost算法原理及代码(代码持续更新。。。)
前言:有监督算法的组成:模型,参数和目标函数 (1)模型:给入指定的Xi如何去预测Yi,姑且认为是一个Y关于X的函数吧,如线性回归Y=∑Wi*Xi (2)参数:就是指系数W (3)目标函数(损失+正则):目标函数的作用是找到比较好的参数W,来更好地预测,基本形式如下: 常见的误差函数有: (1)平方误差: (2)logistic误差函数: 正则化有L2和L1正则化(其区别可以看
2017-06-22 17:57:58 5661 1
原创 排序算法-C++实现:插入排序,冒泡排序
直接插入排序: 整个序列分为有序区和无序区,取第一个元素作为初始有序区,然后第二个开始,依次插入到有序区的合适位置,直到排好序void InsertSort(int arr[],int n){ //遍历数组 for(int i=1;i<=n;i++){ //i-1是有序数组的长度,i是需要插入的元素 for(int j=i;j>0;j--){
2017-06-21 13:54:30 272
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人