- 博客(5)
- 收藏
- 关注
原创 假设检验中两类错误及最小样本量计算
案例: 在互联网这个行业,大家会对产品、排序模型、机制策略等模块不断地进行迭代/创新,来提升整个App的用户体验。那么,怎样能够确认这些模块的迭代/创新是有效性的呢? 大部分公司都会创建一套自己的AB实验系统,通过预先设立的实验生命周期,以及实验所需达到的最小样本量,结合严谨的去异常逻辑和统计学假设检验方法,最终获得一份实验报表,来衡量本次的迭代/创新是否置信有效。 通常考察的效率指标,比方说有:用户下单时长是否降低?点击率(CTR)、 订单成交率(CVR)、独立访客数(UV)、订单数(Or
2021-12-18 19:52:49 8993 3
原创 AUC计算及为何不受样例不均衡的影响
AUC计算及如何看待缓解正负样例不均衡问题AUC预备定义ROC曲线1. 名词定义2. 几何解释AUC计算1. 方法一 :直接计算pair对2. 方法二 :求ROC曲线下的面积AUC为何对正负样例不均衡的数据集评价有效?功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLow
2020-11-14 20:55:33 6767 1
原创 为什么LogisticRegression模型的激活函数要使用Sigmoid函数?
备注:下面均是个人拙见,仅供参考。一、指数分布族在统计应用中,有两大重要的参数族:指数分布族(exponential families),亦称指数型分布族;位置尺寸分布族(location-scale families)。针对指数族分布,响应变量YYY的描述可不再局限于正态分布。概率密度函数定义假设有一列观测样本:{xi,yi}i=1n\{x_i,y_i\}_{i=1}^n{xi,...
2019-12-05 04:10:11 767
原创 Fisher信息量与Cramer-Rao不等式
今天在看一个问题的时候,无意间看到需要证明:E[∂2ln(f(x:θ)∂θ2]=-E{(∂lnf(x;θ)∂θ)2}E[\frac{\partial^2 ln(f(x:\theta)}{\partial \theta^2}] = \textbf{-}E\{(\frac{\partial lnf(x;\theta)}{ \partial\...
2019-10-03 09:33:47 23014 12
原创 切线、法线、梯度之间的关系
一直以来都有一颗写博客的梦,要么是没有时间,要么是笔记本上誊抄。今天强迫自己完成首作。 为什么会想到写这个标题,因为最近回过头来看KKT条件的时候,发现推导过程中提到等高线切线的方向、梯度方向、法向量方向等。不知道大家有没有和我一样的困惑,当很多概念混在一起的时候,脑子瞬间浆糊,...
2019-09-08 03:35:38 24637 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人