自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

TURING.DT

科技改变世界,技术改变人生。

  • 博客(5)
  • 资源 (3)
  • 收藏
  • 关注

转载 机器学习算法线上部署方法

我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁颠屁颠用回了LR,重新训练了一下模型,心里默骂千百遍:工程能力真弱。这些疑问,我们以前碰到过,通过不断的摸索,试验出了不同的复杂机器学习的上线

2017-06-23 10:47:34 1874

转载 分析师与运营协作的9个好习惯

最近两个月我将大量的精力放在了业务分析团队的组建和管理上。不断解决日常中遇到的协作问题,使我学到了一些分析技术以外的知识。由于人多事儿多,所以出现了不少很好的协作案例,值得推广。分析师尽早介入业务。运营伙伴做好合理排期。及时反馈。利用现有数据源解决问题。许多时候,我们并不是缺乏数据,而是“懒”,不去挖掘现有的数据集的潜力,导致分析师觉得有很多简单重复需求。

2017-06-13 15:53:17 429

原创 hadoop集群使用sklearn进行模型训练

为了证实sklearn可以放到hadoop上使用,特别进行了本次试验,但试验中遇到一个疑问,就是reducer节点只能设置为1,那么跟单机训练是否一样了,这个问题目前无法解答。但是,sklearn确实可以通过hadoop方式进行模型训练。一、安装环境服务器默认python版本[root@hadooptest77 ~]# python -VPython 2.6.6需要在所

2017-06-09 16:23:07 5530 3

原创 sklearn与GBDT入门案例

GBDT概念自行网上搜索下,下面入门调用sklearn包中的GBDT安装SCIKIT-LEARN是一个基于Python/numpy/scipy的机器学习库GBDT使用这段代码展示了一个简单的GBDT调用过程import numpy as npfrom sklearn.ensemble import GradientBoostingRegressorgbdt=Grad

2017-06-08 15:39:09 10709

转载 Kaggle 机器学习竞赛冠军及优胜者的源代码汇总

http://dataunion.org/14892.htmlKaggle比赛源代码和讨论的收集整理。Algorithmic Trading Challenge40Solution thread30.Allstate Purchase Prediction Challenge7Rank 2 solution code33 by Alessandr

2017-06-01 14:35:18 3639

Python深度学习(Deep Learning With Python中文版)

本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行深度学习的探索实践,包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后,读者将具备搭建自己的深度学习环境、建立图像识别模型、生成图像和文字等能力。

2018-09-29

Spark大数据分析核心概念技术及实践OCR 中文

Spark大数据分析核心概念技术及实践,深度讲解使用spark技术对大数据进行分析,并给出实践案例

2018-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除