- 博客(6)
- 收藏
- 关注
转载 详解深度学习中的常用优化算法
说到优化算法,入门级必从SGD学起,老司机则会告诉你更好的还有AdaGrad / AdaDelta,或者直接无脑用Adam。可是看看学术界的最新paper,却发现一众大神还在用着入门级的SGD,最多加个Moment或者Nesterov ,还经常会黑一下Adam。比如 UC Berkeley的一篇论文就在Conclusion中写道:Despite the fact that our experime...
2018-05-23 10:27:15 1545
转载 对数据科学家来说最重要的算法和统计模型
摘要: 本文提供了工业中常用的关键算法和统计技术的概要,以及与这些技术相关的短缺资源。作为一个在这个行业已经好几年的数据科学家,在LinkedIn和QuoLa上,我经常接触一些学生或者想转行的人,帮助他们进行机器学习的职业建议或指导方面相关的课程选择。一些问题围绕教育途径和程序的选择,但许多问题的焦点是今天在数据科学领域什么样的算法或模型是常见的。由于可供选择的算法太多了,很难知道从哪里开始学起。...
2018-05-23 10:10:45 260
原创 LR算法在申请评分卡的应用的理论
本文采取的是德国公开的数据做的实验:一.逻辑模型的理论由逻辑回归的基本原理,我们将客户违约的概率表示为p,则正常的概率为1-p。因此,可以得到比率: 此时,客户违约的概率p可表示为: 评分卡设定的...
2018-05-16 12:11:00 1335
原创 Rstudio安装程序包出错
在RStudio安装的时候出现下列程序错误解决方案:手动安装首先在R软件上安装rJava包具体的如下:在R上安装成功之后然后在Rstudio上手动安装程序包第一步:第二步:先选择类型蓝色边框部分然后在红色方框里找到包的所在位置选择然后Install就可以完成了...
2018-05-16 11:41:21 8535
转载 Xgboost算法——Kaggle案例 R语言
作者简介Introduction苏高生,西南财经大学统计学硕士毕业,现就职于中国电信,主要负责企业存量客户大数据分析、数据建模。研究方向:机器学习,最喜欢的编程语言:R语言,没有之一。E-mail:sugs01@outlook.com零、案例背景介绍与建模思路说明1.背景介绍本案例使用的数据为kaggle中“Santander Customer Satisfaction”比赛的数据。此案例为不平衡...
2018-03-28 10:03:21 2822
转载 机器学习笔记(七)Boost算法(GDBT,AdaBoost,XGBoost)原理及实践
在上一篇博客里,我们讨论了关于Bagging的内容,其原理是从现有数据中有放回抽取若干个样本构建分类器,重复若干次建立若干个分类器进行投票,今天我们来讨论另一种算法:提升(Boost)。简单地来说,提升就是指每一步我都产生一个弱预测模型,然后加权累加到总模型中,然后每一步弱预测模型生成的的依据都是损失函数的负梯度方向,这样若干步以后就可以达到逼近损失函数局部最小值的目标。下面开始要不说人话了,我们...
2018-03-28 10:01:38 292
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人