华中科大发表BMJ论文，公共数据库+潜类别分析方法！

最新推荐文章于 2025-05-08 15:25:19 发布

妙趣横生统计学

最新推荐文章于 2025-05-08 15:25:19 发布

阅读量1.3k

点赞数 9

本文链接：https://blog.csdn.net/weixin_44693403/article/details/137663109

版权

本文介绍了潜类别分析作为一种统计技术，如何处理不可直接测量的潜在变量，如社会经济地位。通过实例，探讨了如何构建SES变量，评估模型，以及在健康生活方式与死亡率、心血管疾病研究中的应用。文章详细展示了模型选择过程和主要结果，强调了生活方式在社会经济地位影响健康中的中介作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

编者

近年来，其实发表有关潜类别分析的文章越来越多，而我们要如何理解运用潜类别分析呢？在研究过程中，我们会发现有许多变量（如社会经济地位、生活压力、疾病症状类型、癌症危险行为等）是不能直接测量的。像社会经济地位这个变量，不可直接测量，由家庭收入、职业状况、教育水平、保险等变量组成，那么该如何把社会经济地位合并成一个变量进行统计分析呢？可以利用潜类别分析。今天，我们就利用一篇BMJ文章来介绍潜类别分析是什么以及如何进行潜类别分析。

本篇是潜变量分析方法系列文字第3篇

提到潜类别分析，我们首先要了解两个基本概念：外显变量和潜在变量。在潜类别分析中外显变量和潜在变量都是类别变量。像社会经济地位这个变量不可直接测量属于潜在变量，而家庭收入、职业状况、教育水平、健康保险则属于外显变量。

潜类别分析（Latent Class Analysis, LCA ）是将潜在变量理论与分类变量相结合的一种统计分析技术，通过潜类别模型（ Latent Class Model, LCM），用内在的潜在类别变量来解释外显的类别变量之间的关系，使得外显变量之间的关系经过潜在类别变量估计后，能够维持其局部独立性。

可以将潜类别分析简单地理解为是多个分类变量生成一个新的分类变量，而这个新的分类变量将人群分为几组。