- 博客(5)
- 资源 (5)
- 收藏
- 关注
转载 冒泡排序总结
在开发中,对一组数据进行有序地排列是经常需要做的事情,所以掌握几种甚至更多的排序算法是绝对有必要的本文章介绍的是排序算法中较简单的一种算法:冒泡排序题外话:在深入学习更多排序算法后和在实际使用情况中,冒泡排序的使用还是极少的。它适合数据规模很小的时候,而且它的效率也比较低,但是作为入门的排序算法,还是值得学习的先尝试用最简单的想法去实现排序,以此来比较学习冒
2017-05-26 13:31:21 566
翻译 树模型(1)-入门指南
原文地址:https://www.analyticsvidhya.com/blog/2016/04/complete-tutorial-tree-based-modeling-scratch-in-python/翻译时间:2017年4月翻译作者:FBeetle简介基于树的学习算法被认为是非监督学习方法中最好的并且是最常用的方法之一。基于树的方法使得模型的精确率很高,很稳定和
2017-05-09 19:13:15 24237 1
转载 提升方法:GBDT、XGBOOST、AdaBoost
提升 (boosting) 方法是一种常用的统计学习方法,应用广泛且有效,在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类器性能。Table of ContentsGBDT提升的概念提升算法梯度提升决策树 GBDTXGBOOSTAdaBoost误差分析参考文献GBDT
2017-05-04 16:09:44 5603 2
转载 偏差bias/方差variance 的理解
1. 模型的偏差以及方差:模型的偏差:是一个相对来说简单的概念:训练出来的模型在训练集上的准确度。模型的方差:模型是随机变量。设样本容量为n的训练集为随机变量的集合(X1, X2, ..., Xn),那么模型是以这些随机变量为输入的随机变量函数(其本身仍然是随机变量):F(X1, X2, ..., Xn)。抽样的随机性带来了模型的随机性。我们认为方差越大的模型越容易过拟合:
2017-05-03 11:31:35 2144
转载 ROC AUC指标详解
ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对两者的简单介绍见这里。这篇博文简单介绍ROC和AUC的特点,以及更为深入地,讨论如何作出ROC曲线图以及计算AUC。ROC曲线需要提前说明的是,我们这里只讨论二值分类器。对于分类器,或者说分类算法,评价指标主要有preci
2017-05-03 11:09:29 721
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人