数理统计的相关知识

闲情逸致,写几篇小文,也算是安慰一下自己

------------统计分析常用分析方法-------------

下图总结了统计学中我们常用到的一些统计分析方法,图表来源于Ben老师。从大类来看,分析包含四大类:探索性分析(新产品如何定价[成本、市场竞争和需求]),描述性分析(昨天交易情况如何,偏向于统计维度),解释性分析(指标为什么下降[先看同比情况;然后查看其他因素,周六日、节假日、服务器崩溃、产品做出调整;根据指标构成,层层细分]),预测性分析(明天销量是多少)。
在这里插入图片描述

输入变量只有一个,即单变量

列联表分析:
当输入变量X和输出变量Y都是离散的时候,我们一般怎么样对数据来进行描述呢?一般都是用一个二维表,其实就是列联表分析,也称为交叉分析,在风控领域可能用的比较多,就是通过做交叉分析来卡对应阈值,上线策略。对于离散变量而言,其实有两种展示的维度,一个是统计频次或者说数量,另外一个就是占比,包括总占比、行汇总、列汇总百分比。
卡方检验:
做了列联表分析之后,我们想看离散变量X和Y之间相关性怎么办呢?这就是卡方检验
t检验:
当变量X和Y,一个是离散(只包含2种类别),一个是连续的,怎么来描述他们呢?那就是t检验,t检验是检验2组样本之间的均值是否存在统计学上的差异,比如说班级上男女同学的数学成绩是否存在明显差异,这时候可以用t检验(当然A/B测试也可以使用这种方式),用spss做t检验之后,看p值,一般小于0.05,我们认为男女同学的数学成绩是有明显差异的。在spss里面t检验分为单样本t检验、独立样本t检验(例子就是这种检验方式)、配对样本t检验(检验患者在使用某种药物前后的身体指标是否存在统计学差异)。
单因素方差分析:
t检验是2组样本的均值是否存在统计学差异,如果有3组、4组呢,那么这个时候就是用到了单因素方差分析,方法类似。和t检验和单因素方差分析需要独立性、正态性和方差齐性。
相关分析:
卡方检验是检验离散变量之间的相关性,而连续变量之间的相关性怎么检验呢:使用相关分析,相关性分为正相关和负相关

输入变量有多个

在机器学习中,当预测变量是离散的,统称为分类问题,当预编变量是连续的,统称为回归问题。当预测变量是二分类变量,如0,1,是否违约,可以使用逻辑回归;当预测变量是连续变量可以使用线性回归,当回归系数为正,代表正相关,为负,代表负相关;线性回归和逻辑回归本质上是有区别的,虽然都称为回归,但逻辑回归解决的是分类问题,实际上就是在线性回归的基础上,增加了一个sigmod函数,将其映射到(0,1)区间内,然后再增加一个阈值判断,比如大于0.5判定为1,小于等于0.5判定为0。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值