sklearn
hejp_123
Nothing is impossible
展开
-
pyspark调用sklearn训练好的模型并预测以及spark.ml训练预测
1.首先用sklearn 生成简单的LR模型,并保存本地。import joblibimport pandas as pdfrom sklearn.datasets import make_blobsfrom sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import roc_auc_score#原创 2021-01-15 11:48:48 · 5482 阅读 · 1 评论 -
stacking的详细代码教程
1.Stacking是什么?Stacking简单理解就是讲几个简单的模型,一般采用将它们进行K折交叉验证输出预测结果,然后将每个模型输出的预测结果合并为新的特征,并使用新的模型加以训练。Stacking模型本质上是一种分层的结构,这里简单起见,只分析二级Stacking.假设我们有3个基模型M1、M2、M3。基模型M1,对训练集train训练,然后用于预测train和test的标签列,分...原创 2019-11-09 23:27:01 · 4597 阅读 · 6 评论 -
python实现点击率预估gbdt_lr
GBDT+LR做点击率预估利用skitlearn做了一个简单的实现:# 弱分类器的数目n_estimator = 10# 随机生成分类数据。X, y = make_classification(n_samples=80000)# 切分为测试集和训练集,比例0.5X_train, X_test, y_train, y_test = train_test_split(X, y, te...原创 2018-12-20 16:26:48 · 1214 阅读 · 0 评论