生信星球6 学习R包

最新推荐文章于 2024-09-14 21:53:48 发布

cream_kk

最新推荐文章于 2024-09-14 21:53:48 发布

阅读量68

点赞数

文章标签：学习 r语言 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cream_kk/article/details/134223958

版权

今天要解决的问题是？
镜像设置
安装和加载R包
dplyr五个基础函数
管道操作
dplyr六个处理关系数据

镜像设置

初级模式——选择配置
但是这个是CRAN的镜像，如果要下载Bioconductor的包这个镜像是没有办法用的

tools——packages——primary CRAN repository

升级模式——两行代码

options()$repos 查看镜像
option()设置R运行过程中的一些选项设置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源 options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源

高级模式——设置文件

.Renviron，它是为了设置R的环境变量（这里先不说它）
.Rprofile就是一个代码文件，如果启动时找到这个文件，那么就替我们先运行一遍（这个过程就是在启动Rstudio时完成的）

file.edit('~/.Rprofile') #file.edit()来编辑文件
在文件中添加代码options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

安装和加载R包

在于CRAN网站：install.packages(“包”)

Biocductor：BiocManager::install(“包”)

难安装的包：本地下载后安装（bioconductor/R官网）

加载：library or require

在这里插入图片描述

dplyr五个基础函数

dplyr是tidyverse集合包中一个功能强大的R包，用于进行数据处理和数据操作。

mutate() 新增列
mutate(test, new = Sepal.Length * Sepal.Width) #新增加列还顺便做了计算

在这里插入图片描述
select() 按列筛选
select(test,1) #按列号筛选
select(test,c(1,5))

select(test,Sepal.Length) #按列名筛选

vars <- c("Petal.Length", "Petal.Width") #按列名筛选
select(test, one_of(vars))

filter() 筛选行
filter(test, Species == "setosa") #行的字符名词

filter(test, Species == "setosa"&Sepal.Length > 5 ) #行的数值大小

filter(test, Species %in% c("setosa","versicolor"))筛选出Species为setosa或versicolor的所有行

arrange() 按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序

arrange(test, desc(Sepal.Length))#用desc从大到小

summarise() 汇总
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差

group_by(test, Species)
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))

管道操作

%>% (cmd/ctr + shift + M)
加载任意一个tidyverse包即可用管道符号

“其作用是将前一步的结果直接传参给下一步的函数，从而省略了中间的赋值步骤，可以大量减少内存中的对象，节省内存。” “将%>%左边的对象传递给右边的函数，作为第一个选项的设置（或剩下唯一一个选项的设置）”。

在这里插入图片描述

dplyr六个处理关系数据

test1 <- data.frame(x = c(‘b’,‘e’,‘f’,‘x’),
z = c(“A”,“B”,“C”,‘D’),
stringsAsFactors = F)
test2 <- data.frame(x = c(‘a’,‘b’,‘c’,‘d’,‘e’,‘f’),
y = c(1,2,3,4,5,6),
stringsAsFactors = F)
这是产生了test1和test2两个数据框

inner_join(test1, test2, by = "x")
内部连接：取test1和test2两个数据框的交集

left_join(test1, test2, by = 'x')和left_join(test2, test1, by = 'x')两个命令结果是不同的。分别以左侧的数据框为基础，进行连接

full_join( test1, test2, by = 'x') 全部数据都用上

semi_join(x = test1, y = test2, by = 'x')
半连接，意思是把x表里的数据和y去找能匹配上的。

anti_join(x = test2, y = test1, by = 'x')
反连接，正好相反，把x表里的数据去和y比对，找不能匹配上的。

bind_rows()和bind_cols()两个函数用于简单合并。 bind_rows()是合并行，要求列数必须一致，才能合并的了。bind_cols()是合并列，则要行数一致才行。

写在最后

Q：今日学了什么？
dplyr五个基础函数+ dplyr六个处理关系数据要多加运用！！！
管道操作再深刻点理解
回去复习一下第一节

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

cream_kk CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

183万+: 周排名

209万+: 总排名

283: 访问

: 等级

50: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

生信星球2
CSDN-Ada助手: 恭喜您开始博客创作！看到您的第一篇博客《生信星球2》，我感到非常高兴。您选择了一个非常有趣的主题，我期待着在您的博客中了解更多关于生信的内容。作为一个读者，我建议您可以进一步探索生信领域的前沿研究和最新进展，或者分享一些实践经验和技巧。希望您能继续保持谦虚的态度，不断学习和提升自己，期待您更多优质的博客作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
生信星球4-R语言基础
CSDN-Ada助手: 恭喜您写完了第三篇博客！标题“生信星球4-R语言基础”让我非常期待地阅读了您的博文。看到您持续创作，我真的非常高兴。在博客中介绍R语言基础知识，我相信对于生信领域的学习者来说将会是一份非常宝贵的资料。在接下来的创作中，我建议您可以进一步拓展R语言的应用场景，例如结合生物数据的处理与分析，或者是利用R语言进行可视化展示等等。这些内容将更加丰富您的博客，并为读者提供更多实用的技能和知识。同时，您可以考虑与其他生信领域的专家或者同行进行交流，分享彼此的经验和见解，让博客变得更加多元化和有趣。再次祝贺您的创作，并期待您的下一篇博客！谢谢您的分享和努力！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
生信星球3-linux环境下的软件安装
CSDN-Ada助手: 非常棒的博文！非常鼓励你继续创作！在生信领域，除了Linux环境下的软件安装，还有一些相关的扩展知识和技能可以探索。比如，你可以了解一下生物信息学中的常用软件包，比如SAMtools、BEDtools、GATK等，它们在基因组数据分析中非常常用。此外，你还可以学习一些编程技能，比如Python或R语言，在数据处理和可视化方面非常有用。希望这些建议对你有所帮助，期待你未来的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。