16种常用的数据分析方法-相关分析

25 篇文章 2 订阅
23 篇文章 0 订阅

相关性分析研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。

 

相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。

 

如:身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。

 

 

 

 

相关性种类

 

 

 

 

客观事物之间的相关性,大致可归纳为两大类:

 

 

一、函数关系

 

 

函数关系是两个变量的取值存在一个函数来唯一描述。

 

比如销售额与销售量之间的关系,可用函数y=px(y表示销售额,p表示单价,x表示销售量)来表示。所以,销售量和销售额存在函数关系。

这一类关系,不是我们关注的重点。

 

 

 

二、统计关系

 

 

统计关系,指两事物之间的非一一对应关系,即当变量x取一定值时,另一个变量y虽然不唯一确定,但按某种规律在一定的范围内发生变化。

 

比如:子女身高与父母身高、广告费用与销售额的关系,是无法用一个函数关系唯一确定其取值的,但这些变量之间确实存在一定的关系。大多数情况下,父母身高越高,子女的身高也就越高;广告费用花得越多,其销售额也相对越多。

 

这种关系,就叫做统计关系。

 

按照相关表现形式,又可分为不同的相关类型,详见下图:

 

 

 

 

 

 

 

相关性描述方式

 

 

 

 

描述两个变量是否有相关性,常见的方式有3种:

 

1.相关图(典型的如散点图和列联表等等)

 

2.相关系数

 

3.统计显著性

 

 

用可视化的方式来呈现各种相关性,常用散点图,如下图:

 

 

 

 

 

相关性分析步骤

 

 

 

 

Step1:相关分析前,首先通过散点图了解变量间大致的关系情况。

 

如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。

 

 

如上图,展现了平时成绩与能力评分之间的关系情况:X增大时,Y会明显的增大,说明X和Y之间有着正向相关关系。

 

 

Step2:计算相关系数

 

散点图能够展现变量之间的关系情况,但不精确。还需要通过相关分析得到相关系数,以数值的方式精准反映相关程度。

 

相关系数常见有三类,分别是:

 

Pearson相关系数、

Spearman等级相关系数
Kendall相关系数。

 

 

最常使用的是Pearson相关系数;当数据不满足正态性时,则使用Spearman相关系数,Kendall相关系数用于判断数据一致性,比如裁判打分。

 

 

 

 

相关性分析案例

 

 

 

 

  • 数据集说明

 

某公司员工的基本情况,数据集含3列,分别为:性别、年龄、工资,

 

分析主题:希望了解员工年龄和工资水平之间的关系(企业人事部门的读者可关心一下)。

 

 

 

  • 相关性可视化

 

如图,用散点图先观察2个变的关系。

 

 

散点图显示2个变量似乎存在一定的相关性,为了得到更准确的结论,接下来要行为更准确的相关分析验证,让分析结果更清晰。

 

 

  • 相关系数计算-SPSS分析过程

 

 

1.菜单操作:分析——相关——双变量

 

 

 

 

2.结果解读

 

 

 

原假设:工资与年龄间不存在相关关系

 

计算结果sig=0.002,即原假设不成立。现实意义为年龄与工资水平有着极显著的相关关系,也就是说随着年龄的增加,工资会逐渐下降。

 

  • 6
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 16S 测序数据分析可以用来研究牙周炎患者相兹菌的相对丰度变化。通过对牙周组织样本的16S rRNA基因测序,可以鉴定出牙周组织中存在的微生物类。接着,通过比较健康与患病样本的微生物组成差异,可以确定与牙周炎患病相关的菌。最后,通过计相对丰度的变化,可以得出牙周炎患病时相关菌相对丰度的变化情况。 ### 回答2: 16s测序是一常用的微生物分析技术,可以用来研究牙周炎患者口腔中菌群的相对丰度变化。 牙周炎是一常见的口腔疾病,其发病机制与口腔微生物变化密切相关。通过16s测序可以对口腔中的细菌群进行高通量测序,并对各个菌的相对丰度进行分析。 在进行16s测序后,我们可以得到每个样本中各个菌的相对丰度数据。通过比较患者组和健康对照组的数据,可以发现牙周炎患者口腔中某些菌的相对丰度发生了变化。 一般来说,与牙周炎相关的细菌主要包括放线菌、厌氧菌、链球菌等。在牙周炎患者中,这些致病菌的相对丰度往往会增加。与之相反,一些有益菌如拟杆菌可能会减少。 通过对16s测序数据进行统计分析,我们可以量化不同菌在牙周炎发病中的相对贡献,并找出其相关性。这些数据将有助于我们进一步了解牙周炎的病因、发展过程以及寻找相关治疗策略。 要注意的是,16s测序只能提供菌群层面的相对丰度信息,无法提供具体的菌株信息。此外,牙周炎的发病机制是复杂的,除了口腔细菌的变化外,还可能与宿主因素、生活习惯等多因素相关。因此,牙周炎的研究需要综合多技术和方法来深入探究。 ### 回答3: 牙周炎是口腔疾病中常见的一,其发生和发展过程与菌的变化密切相关。最近,16s测序技术在研究菌群结构上得到广泛应用。通过对16s测序数据的分析,可以揭示牙周炎患病相关菌的相对丰度变化。 首先,我们需要收集患者的样本,如牙龈或牙周膜组织、唾液和口腔拭子等。然后将这些样本进行DNA提取,并利用PCR扩增16s rRNA基因区域。接下来,通过高通量测序技术将这些扩增片段测序,获得大量的序列数据。 之后,对得到的测序数据进行初步处理,如质量过滤、去除引物和低质量序列等。将清理后的数据16s数据库进行比对,可以将这些序列归类到相应的菌群。通过比较不同样本之间的相对丰度,我们可以得到不同菌在牙周炎患者中的变化趋势。 接下来,我们可以使用统计学方法来分析相对丰度数据,比如计平均相对丰度、标准偏差等。通过统计显著性检验,我们可以确定哪些菌在牙周炎患者中的相对丰度发生了显著变化。 最后,通过解读分析结果,我们可以了解到在牙周炎患病过程中,哪些菌的相对丰度发生了变化。比如,一些致病菌可能相对增加,而其他有益菌可能相对减少。这些分析结果可以为牙周炎的治疗和预防提供重要的依据。 总之,通过16s测序数据分析,我们可以揭示牙周炎患病相关菌的相对丰度变化,进而深入了解牙周炎发生和发展的机制,为临床治疗和预防提供科学依据。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值