data science
Keyboard Interrupt
github: https://github.com/ScottPanIE
展开
-
集成学习Ensemble Learning整理
目录集成学习序列化方法 & 并行化方法Random ForestGBDTRF与GBDT区别XGBOOST(极端梯度提升)XGBoost优缺点LightGBMXGBoost调参LightGBM调参集成学习集成学习的核心思想是使用弱学习器(线性模型,决策树等)进行加权求和,从而产生性能较为强大的强学习器。RF,GBDT,XGB 与 LGBM都属于集成学习,首先对集成学习做一个初步的介绍。集成学习(Ensemble Learning)的目的是通过结合多个基本学习器的预测结果来改善基本学习器的泛化能力和原创 2020-11-16 19:06:36 · 600 阅读 · 0 评论 -
pandas 1.0翻译与部分理解
CONTENTAbstractPandas 1.0.0 What's New?New Deprecation PolicyEnhancementsUsing Numba in rolling.apply and expanding.applyDefining custom windows for rolling operationsConverting to MarkdownExperimental New FeaturesExperimental NA scalar to denote missing v原创 2020-07-16 11:36:15 · 817 阅读 · 0 评论 -
群体稳定度指标PSI
群体稳定性指标PSI(Population Stability Index)是衡量模型的预测值与实际值偏差大小的指标。PSI = sum((实际占比-预期占比)* ln(实际占比/预期占比))举例:比如训练一个logistic回归模型,预测时候会有个概率输出p。测试集上的输出设定为p1吧,将它从小到大排序后10等分,如0-0.1,0.1-0.2,…。现在用这个模型去对新的样本进行预测,预...原创 2019-06-19 17:05:08 · 2551 阅读 · 0 评论