模型综述
统计分析分析
同名微信公众号:统计分析分析
展开
-
PSM 倾向性匹配(一)基础知识
作者:Ernnnnb站:Ernnnn公众号:统计分析分析所有文章都在公众号,b站有视频版PSM 倾向性匹配文章目录1.基础知识1.1 什么叫处理效应1.2ATE ATT ATU1.3 选择难题2.随机分组1.基础知识1.1 什么叫处理效应对于个体iii而言,其未来收入为yyy ,有yi={y1i 若 Di=1y0i 若 Di=0y_{i}=\left\{\begin{array}{ll}y_{1 i} & \text { 若 } D_.原创 2020-10-06 22:21:17 · 9823 阅读 · 0 评论 -
两总体 t检验与差分估计量的比较
作者:Ernnnnb站:Ernnnn公众号:统计分析分析两总体 t 检验与差分估计量的比较文章目录*两总体 t 检验与差分估计量的比较*1. t检验2.差分估计量3. Stata 验证1. t检验两总体的t检验,可以分为独立样本和配对样本的两大分类。独立样本方差已知方差未知但相等方差未知且不相等配对样本比如在小样本下,如果方差未知但相等:t=X‾1−X‾2Set = \frac{\overline X_1 - \overline X_2}{\sq.原创 2020-10-05 18:45:52 · 1565 阅读 · 0 评论 -
随机森林原理详解 random forest 代码+参数讲解
事实上随机森林的基本单元决策树很早就被提出来了,只不过单个决策树效果不好。这个情况和神经网络差不多。到了2001年Breiman把分类树组合成随机森林(Breiman 2001a),即在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树的结果。在运算没有增加的情况下,精度提高了不少。进入正题随机森林由两个部分组成随机 和 森林森林简单来说就是很多颗树,而这个树...原创 2019-03-01 19:06:18 · 14738 阅读 · 1 评论 -
xgboost 原论文精读 原理推导 + sklearn参数讲解
梯度提升树现在站在大神的角度来回顾一下梯度提升树正则化的目标函数给定训练集D,含有n个样本m个特征一个含有k棵树的集成模型F当然就是回归决策树的空间啦。q是每棵树的结构,T是每个树的叶子数量。每棵树都有独立的树结构q以及叶子权重w。不同于决策树,每个回归树的叶子都包含了一个连续的分数,我们使用w同表示这个叶子的分数。举个例子来说,我们将使用给定树的决策规则来分类为叶子。那么最终的预测...原创 2019-03-05 16:51:59 · 499 阅读 · 0 评论 -
GBDT 原理推导+sklearn参数解释
adaboost算法adaboost是boosting方法中的一种,主要思想是提高分类错误的样本的权值,降低分类正确样本的权值。这样做的方法存在两个问题第一,如何更新样本权值第二,如何组合成一个强分类器带着这些问题来看算法的具体步骤:输入:训练集数据;以及弱学习算法输出:强分类器1.初始化训练数据的权值在这里设为1/N2.遍历1-ma.使用具有权值分布的训练数据训练分类器...原创 2019-03-03 21:51:28 · 1058 阅读 · 0 评论 -
各种分类指标的通俗理解 +相似度的通俗理解
如果那个类型不重要,只关心他的准确率那么可以考虑使用准确率如果不是那么考虑以下的指标。混淆矩阵上面这些怎么记呢? 预测对错+预测结果。比如True Positive 就是预测对了,预测为正。很符合西方人的思维,先说结果再说原因。而中国人呢,就是先说原因,再说结果。查全率recall:实际为正的样本里面预测为正的比例查准率preision:预测为正的样本里面实际为正的比例那么什么情...原创 2019-03-07 22:16:40 · 1058 阅读 · 0 评论