r语言dataellipse_R语言|连续性变量转为分类变量,界值可为均数、中位数、上下四分位数,非常方便...

本文介绍了在R语言中如何将连续性变量转换为分类变量,通过ifelse函数、apply函数以及for循环展示了不同方法,包括以均值、中位数、四分位数为界值进行转化,适用于批量处理大量数据。
摘要由CSDN通过智能技术生成

做数据分析时,经常会遇到需要把连续性变量转为分类变量。

一 读入数据

读入TCGA的表达量数据,截取部分数据进行示范

#TCGA的表达量数据#setwd()data

7d870d9d100a681f6613d1f64ed597a5.png

row.names=1 :读入数据的第一列作为行名check.names=FALSE:标题保持原样可以自行试一下,分别去掉这两个参数,然后比较下数据的差异

二 批量转化

1 ifelse转化单一列

#将TCGA-97-7938-01A根据medain转为 高 低data1 median(data1[,"ENSG00000000003.13"]),"High","Low")data1[1:4,1:4]

ccf41e5aad6dd3df69493de97cdeb499.png

可以看到ENSG00000000003.13基因的表达量已经转为高 低 二分类了。

分段阈值:还可以是均值,四分卫,10%,或者具体数值

#按照均值分data1[,"ENSG00000000460.15"] mean(data1[,"ENSG00000000460.15"]),"High",

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值