机器学习
文章平均质量分 96
snowdroptulip
菜鸟
展开
-
常用异常点检测算法
机器学习-异常检测算法(一):Isolation Forest机器学习-异常检测算法(二):Local Outlier Factor机器学习-异常检测算法(三):Principal Component Analysis转载 2020-06-19 15:39:41 · 506 阅读 · 0 评论 -
约束规划——拉格朗日乘数法
拉格朗日乘数法拉格朗日乘数法的基本思想拉格朗日乘数法(Lagrange Multiplier Method)是一种优化算法,拉格朗日乘子法主要用于解决约束优化问题,它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个变量的无约束优化问题。拉格朗日乘子背后的数学意义是其为约束方程梯度线性组合中每个向量的系数。如何将一个含有n个变量和k个约束条件...原创 2020-04-15 20:12:49 · 7371 阅读 · 0 评论 -
WOE和IV
这篇文章参考了https://blog.csdn.net/shenxiaoming77/article/details/78771698,如果想要看WOE和IV的例子可以到这里学习。另外kaggle有一篇特别好的文章,建议大家可以去看看:https://www.kaggle.com/pavansanagapati/weight-of-evidence-woe-information-value...原创 2020-03-09 15:36:34 · 320 阅读 · 0 评论 -
分类器评估指标——混淆矩阵 ROC AUC KS AR PSI Lift Gain
以下混淆矩阵、ROC、KS值、AR值都是二分类模型的评估指标,PSI是评估模型稳定性的指标。1、混淆矩阵混淆矩阵是最简单、最基础的分类的评估指标,在这里只讲二分类的混淆矩阵,多分类与二分类类似。以下是二分类的混淆矩阵实现:from sklearn.metrics import confusion_matriximport matplotlib.pyplot as ...原创 2020-01-15 13:24:46 · 6854 阅读 · 2 评论 -
机器学习——陈天奇Boosted Tree(GBDT)详解
工作了好多年,从最开始使用xgboost,到后来的lightGBM,它们的底层原理都是Boosted Tree,之前一直没有做过总结,今天我就把陈天奇的Boosted Tree翻译一下,让大家从原理了解什么是Boosted Tree,如果有任何理解或者描述错误的地方,欢迎大家批评指正。如果涉及到我自己的理解的内容,我会用绿色的字来表示。建议大家直接看原文档,链接为:https://home...翻译 2019-12-09 20:04:09 · 3245 阅读 · 0 评论