- 博客(5)
- 资源 (3)
- 收藏
- 关注
转载 机器学习算法线上部署方法
我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁颠屁颠用回了LR,重新训练了一下模型,心里默骂千百遍:工程能力真弱。这些疑问,我们以前碰到过,通过不断的摸索,试验出了不同的复杂机器学习的上线
2017-06-23 10:47:34 1875
转载 分析师与运营协作的9个好习惯
最近两个月我将大量的精力放在了业务分析团队的组建和管理上。不断解决日常中遇到的协作问题,使我学到了一些分析技术以外的知识。由于人多事儿多,所以出现了不少很好的协作案例,值得推广。分析师尽早介入业务。运营伙伴做好合理排期。及时反馈。利用现有数据源解决问题。许多时候,我们并不是缺乏数据,而是“懒”,不去挖掘现有的数据集的潜力,导致分析师觉得有很多简单重复需求。
2017-06-13 15:53:17 430
原创 hadoop集群使用sklearn进行模型训练
为了证实sklearn可以放到hadoop上使用,特别进行了本次试验,但试验中遇到一个疑问,就是reducer节点只能设置为1,那么跟单机训练是否一样了,这个问题目前无法解答。但是,sklearn确实可以通过hadoop方式进行模型训练。一、安装环境服务器默认python版本[root@hadooptest77 ~]# python -VPython 2.6.6需要在所
2017-06-09 16:23:07 5532 3
原创 sklearn与GBDT入门案例
GBDT概念自行网上搜索下,下面入门调用sklearn包中的GBDT安装SCIKIT-LEARN是一个基于Python/numpy/scipy的机器学习库GBDT使用这段代码展示了一个简单的GBDT调用过程import numpy as npfrom sklearn.ensemble import GradientBoostingRegressorgbdt=Grad
2017-06-08 15:39:09 10713
转载 Kaggle 机器学习竞赛冠军及优胜者的源代码汇总
http://dataunion.org/14892.htmlKaggle比赛源代码和讨论的收集整理。Algorithmic Trading Challenge40Solution thread30.Allstate Purchase Prediction Challenge7Rank 2 solution code33 by Alessandr
2017-06-01 14:35:18 3640
Python深度学习(Deep Learning With Python中文版)
2018-09-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人