R语言的数据变量类型

下面内容摘录自《R 语言与数据科学的终极指南》专栏文章的部分内容,每篇文章都在 5000 字以上,质量平均分高达 94 分,看全文请点击下面链接

3章1节:数据的基本概念以及 R 中的数据结构、向量与矩阵的创建及运算-CSDN博客文章浏览阅读45次。本文详细介绍了R语言中常见的数据结构的向量和矩阵。通过掌握这些数据结构的基本概念和操作技巧,可以更高效地处理和分析数据。https://blog.csdn.net/2301_79425796/article/details/140734026?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22140734026%22%2C%22source%22%3A%222301_79425796%22%7D

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文

2、变量的类型​​​​​​​

在数据科学和统计学中,变量是研究对象的基本要素。根据变量的性质和特点,可以将其分为两大类:分类型变量(Categorical variables)和数值型变量(Numerical variables)。这两类变量在数据分析和处理时有着不同的应用和方法。

分类型变量(Categorical Variables)

分类型变量,又称定性变量(Qualitative variables),是指通过定性方法确定的,用于描述观察单位某项属性特征或类别的指标。根据分类项数和类别之间是否存在顺序关系,分类型变量可以进一步分为有序分类变量(Ordinal categorical variables)和无序分类变量(Unordered categorical variables)。

有序分类变量(Ordinal Categorical Variables)

有序分类变量是指各类别之间存在程度上的差别,类别之间具有一定的顺序。例如:

  • 尿糖化验结果:(-、±、+、++、+++)
  • 疗效:治愈、显效、好转、无效

在这些例子中,每个类别不仅描述了不同的状态,还暗示了这些状态之间的顺序或等级关系。

无序分类变量(Unordered Categorical Variables)

无序分类变量是指各类别或属性之间无程度和顺序的差别。例如:

  • 性别:男、女
  • 药物反应:阴性、阳性
  • 血型:O、A、B、AB

这些变量的各类别之间没有顺序关系,每个类别只是不同的分类,不存在高低或优劣之分。

数值型变量(Numerical Variables)

数值型变量,又称定量变量(Quantitative variables),是指通过定量方法测定的,具有数值大小(高低或多少)的指标。根据其取值的连续性,数值型变量可以分为连续型变量(Continuous variables)和离散型变量(Discrete variables)。

连续型变量(Continuous Variables)

连续型变量是在一定区间内可以任意取值并且可以取无限多个数值的变量。例如:

  • 身高(Height)
  • 体重(Weight)
  • 血压(Blood pressure)

这些变量在其取值范围内是连续的,可以是任何实数值。

离散型变量(Discrete Variables)

离散型变量是通过计数方式取得的变量,取值为有限个或可数的离散数值。例如:

  • 脉搏(Pulse rate)
  • 白细胞计数(White blood cell count)

这些变量的取值通常是整数,表示具体的计数结果。

类型子类型示例描述
分类型变量有序分类变量尿糖化验结果(-、±、+、++、+++);疗效(治愈、显效、好转、无效)各类别之间存在顺序关系
无序分类变量性别(男、女);药物反应(阴性、阳性);血型(O、A、B、AB)各类别之间无顺序关系
数值型变量连续型变量身高、体重、血压变量在一定区间内可以取任意值
离散型变量脉搏、白细胞计数变量取值为有限个或可数的离散数值

二、R的数据结构

1、向量(Vector)

向量是R语言中最基础的数据结构,几乎所有其他数据结构都是由向量构成的。向量可以包含数值、字符、逻辑值、复数等类型的数据。

数值型向量(Numeric Vector)

数值向量(Numeric vector)指的是由数值构成的向量。单个的数值(即标量数值)属于最简单的数值向量。数值向量属于最常运用的数据类型,并且几乎是所有数据分析的基础。接下来,我们通过函数 c()来生成一个整数值变量。

.......后面部分请看原文

欢迎订阅我们专栏,深度系统地学习R语言。 

为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用,由于众多同学在计算机编程上经验欠缺,特此开设《R 语言与数据科学的终极指南》专栏。该专栏每周至少会定期更新三篇,直到整个专栏更新完成。每篇文章都在 5000 字以上,质量平均分高达 94 分。要提醒大家的是,每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!

专栏《R 语言与数据科学的终极指南》链接:https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学和人工智能兴趣组

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值