自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 spark调优详解

本文参考中华石杉老师的课程总结。后面一部分是总结了一下当spark必须要按列处理时的调优方式。1、spark调优之分配更多资源/usr/local/spark/bin/spark-submit \--class cn.spark.sparktest.core.WordCountCluster \--num-executors 3 \  配置executor的数量--driver...

2018-08-19 18:48:21 1492 1

原创 数据挖掘之stacking模型融合(以阿里妈妈广告点击率预估比赛为例)

前面的特征工程部分参考大神操作,此代码非比赛真是代码,可以在特征工程方面多下功夫,这次比赛经过模型融合后的最好成绩为96名(5000队)#coding=utf-8import pandas as pdimport numpy as npimport scipy as spimport lightgbm as lgbfrom sklearn.ensemble import Rando...

2018-07-31 15:27:46 1051

原创 auto sklearn安装(mac版)

需要python3的环境安装swig3ruby -e "$(curl --insecure -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"brew install swig3给指定的文件夹赋予写权限:sudo chmode 777 文件夹brew link swig 安装...

2018-07-31 15:14:53 2573

原创 基于Tpot的遗传算法自动化建模之核心源码解读

遗传算法及scala实现见文章:https://blog.csdn.net/hgy0403/article/details/81287490Tpot的涉及到的建模过程,以TPOT light为例主要有3块:Classifiers、Preprocesssors、Selectors,tpot的遗传算法优化是以pipeline为基础的,也就是说pipeline就相当于基因序列。通过构建初始pipel...

2018-07-31 14:50:09 2795

原创 遗传算法及scala实现

我们先从查尔斯 · 达尔文的一句名言开始:能够生存下来的往往不是最强大的物种,也不是最聪明的物种,而是最能适应环境的物种。遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化论知识作为遗传算法生物背景的介绍,下面内容了解...

2018-07-30 18:41:56 1755

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除