sklearn
牛腩面
这个作者很懒,什么都没留下…
展开
-
特征工程之'sklearn--preprocessing包'
目录一:sklearn中的归一化1)均值-标准差缩放--StandardScaler()(常用)2)min-max标准化--MinMaxScaler()3)最大值标准化--MaxAbsScaler()4)规范化--normalize()5)二值化--Binarizer()6)编码的分类特征--OneHotEncoder()(常用)7)填补缺失值--Imputer...原创 2018-11-22 21:05:25 · 1642 阅读 · 0 评论 -
随机采样
方法一: from sklearn.utils import shuffle方法二:df.sample(frac=1)方法三:np.random.permutation()+pd.take() import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(50).reshape(10,5),columns=...原创 2018-11-30 17:13:21 · 409 阅读 · 0 评论 -
Xgboost 官方源码(python版本)
官网地址一.XGBClassifierxgboost.XGBClassifier(max_depth=3, learning_rate=0.1, n_estimators=100, silent=True, objectiv...翻译 2018-12-22 22:48:03 · 4112 阅读 · 0 评论 -
np.newaxis
np.newaxis的作用就是在这一位置增加一个一维,这一位置指的是np.newaxis所在的位置,比较抽象,需要配合例子理解。x1 = np.array([1, 2, 3, 4, 5])# the shape of x1 is (5,)x1_new = x1[:, np.newaxis]# now, the shape of x1_new is (5, 1)# array([[1]...转载 2019-01-26 16:21:24 · 290 阅读 · 0 评论 -
StratifiedShuffleSplit与StratifiedKFold区别
StratifiedShuffleSplit StratifiedKFold 训练集、测试集划分 通过指定 test_size 或train_size 通过指定 cv 是否支持shuffle 是 是 区别 保证每组训练集(或测试集)的数据分布一致,但不一定与原始数据分布一致 保证训练集(或测试集)与原始数据的...原创 2019-07-18 17:11:11 · 2593 阅读 · 0 评论 -
ubuntu18 LightGBM GPU版安装
环境:ubuntu 18 python3.7方法一:自己编译源码安装1.安装依赖环境 OpenCL 1.2 ,libboost$ sudo apt-get install ocl-icd-libopencl1$ sudo apt-get install ocl-icd-opencl-dev$ sudo apt-get install libboost-dev$ sudo...原创 2019-08-25 14:56:03 · 1490 阅读 · 0 评论