Project description
itchat is a open souce wechat api project for personal account.
It enables you to access your personal wechat account through command line.
相关与回归分析:
两变量相关分析
一、相关表与相关图
(一)相关表
1.单变量分组相关表:自变量分组且计算次数,因变量只计算平均数。
2.双变量分组相关表:对自变量与因变量均进行分组。
(二)相关图:散点图
例如:一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、固定资产投资等项目的货款。近年来,该银行的贷款额平稳增长,但不良贷款也有较大比例的上升,这给银行业务的发展带来较大的压力。为弄清不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以找出控制不良贷款的办法。下表就是该银行所属的25家分行的2012年的有关业务数据。
针对25家分行的2012年的有关业务数据,管理者想知道:
1.不良贷款是否与贷款余额、累计应收贷款、贷款项目个数和固定资产投资额等因素之间有没有关系?
2.如果有关系,它们之间是一种什么关系?
3.不良贷款与上述4个因素之间,关系强度如何?
二、相关系数(correlation coefficient)
(一)相关系数定义
1.对变量之间关系密切程度的度量;
2.对两个变量之间线性相关程度的度量称为简单相关系数;
问:若令账单消费额为y,小费为x,则r的取值是否改变?
(五)样本相关系数的特性
1.两变量均为随机变量;
(六)关于相关的普通错误
在解释关于相关的结果中会出现三种普通的错误:
1.相关就一定意味着因果关系。如:一项研究表明,统计学教授的薪金与每人的啤酒消费量之间有很强的正相关关系,但这两个变量都受经济形势的影响。(隐藏变量)
2.相关系数为0,一定不相关。
3.基于平均数进行相关分析与基于个体数据进行相关分析,其相关程度不一样。如:一项研究中,关于个人收入和教育的成对数据产生了一个0.4的线性相关系数,但当使用区域平均时,线性相关系数变为0.7。