数学相关理论知识
主要是介绍与记录一些算法的基础知识,如数学定理、公式等
hhhh106
数据分析汪
展开
-
ABtest依据:假设检验
相关名词:弃真错误、取伪错误 ,原假设、备择假设,双侧检验、左侧检验、右侧检验,统计量:Z统计量、T统计量,拒绝域、接受域,显著水平背景:一般假设检验用在实际工作中是在做AB实验时,用于确定一个新的策略、产品是否优于之前,因为对比新旧策略不可能把所有的目标用户都计算一下相关指标,比较优劣。一般是进行抽样,保证各方面条件一致的情况下,二者差异的地方只有策略不同。举个例子,我想要对比新旧策略A、B的效果,一般会有2种假设:原假设:A < B ; 备择假设: A > B...原创 2022-03-19 22:14:28 · 612 阅读 · 0 评论 -
牛顿冷却定律,衰减因子alpha
牛顿冷却定律:物体的冷却速度,与其当前温度与室温之间的温差成正比。 - T(t)是温度(T)的时间(t)函数。微积分知识告诉我们,温度变化(冷却)的速率就是温度函数的导数T'(t)。 - H代表室温,T(t)-H就是当前温度与室温之间的温差。由于当前温度高于室温,所以这是一个正值。 - 常数α(α>0)表示室温与降温速率之间的比例关系。前面的负号表示降温。不同的物质有不同的α值。解析后本期温度 = 上一期温度 x exp(-(冷却系数) x 间隔的小时数)-----这个可原创 2020-09-09 09:57:18 · 2548 阅读 · 1 评论 -
常用的损失函数
损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:...原创 2022-02-28 21:45:12 · 2862 阅读 · 0 评论 -
HASH的作用
数据经过HASH后,类似加密,其他人就无法看到真实的数据情况,对于敏感明文数据,可以用这种方式保存。同时HASH也可以利用HASH值的唯一性,用于数据查找与分桶。HASH的构造有多种方法,不变的思想是在现有数据的基础上,通过某种映射函数,把数据变换成另一种形式,数据变换后尽可能不产生冲突,具有唯一性。如果产生冲突,可以在原有HASH值的基础上再HASH,或者使用2种HASH算法具体实现的时候,常见的HASH算法有MD5,SHA-1参考资料:hash算法原理详解_至道-CSDN博客_哈希算原创 2022-03-13 17:12:11 · 1330 阅读 · 0 评论 -
泰勒展开:一阶,二阶
泰勒展开式:当时,是麦克劳林公式麦克劳林公式:看下图可以发现,当多项式的阶数达到一定的数值,会很接近幂函数。GBDT的损失函数是一阶泰勒展开,XGB是二阶展开梯度下降法与泰勒级数的关系:梯度下降法背后的原理 - 知乎梯度下降法和一阶泰勒展开的关系 - 知乎...原创 2022-03-06 15:52:44 · 18057 阅读 · 0 评论 -
日常学习-20200817-20200221
1、大多数元素都是0的矩阵称为稀疏矩阵,否则称为稠密矩阵。规模巨大的稀疏矩阵在应用机器学习中很常见,尤其在自然语言处理领域中,例如独热编码。稀疏矩阵的表示、计算会增加空间和时间复杂度,因此描述稀疏矩阵的稀疏性需要进行特殊的表示,以提高存储和计算性能。2、南大周志华老师写的《机器学习》这本书上原文:“为普通稠密表达的样本找到合适的字典,将样本转化为合适的稀疏表达形式,从而使学习任务得以简化,模型复杂度得以降低,通常称为‘字典学习’(dictionary learning),亦称‘稀疏编码’(sparse原创 2020-08-18 16:58:04 · 112 阅读 · 0 评论