R语言
小八四爱吃甜食
这个作者很懒,什么都没留下…
展开
-
R语言作图——热图聚类及其聚类结果输出
不多说了,做个记录,代码如下。原创 2023-06-08 17:57:58 · 1136 阅读 · 0 评论 -
基因注释R包——annotatr介绍
下一代测序实验和生物信息学管道产生的基因组区域在注释基因组特征时更有意义。出现在外显子或增强子中的SNP可能比出现在基因间区域的SNP更令人感兴趣。有趣的是,我们发现一种特定的转录因子主要结合在启动子中,而另一种转录因子主要结合在3’非翻译区。含有CpG岛的启动子的超甲基化可能表明一种情况下与另一种情况下不同的调节机制。annotatr提供了基因组注释和一组功能,用于在基因组注释的上下文中读取、相交、总结和可视化基因组区域。原创 2023-05-25 15:28:36 · 2580 阅读 · 3 评论 -
R语言处理数据——dplyr包的使用(1)
首先根据以下两个数据集进行处理:attend.csv主要需求如下:两个数据有共同的列,需要合并他们;根据weekattend获得10个最佳的团队;绘制图表,根据playoff和non-playoff选择top10的球队作图。原创 2023-04-20 17:26:40 · 196 阅读 · 0 评论 -
R语言处理数据——替换数据中某元素
以上就是替换数据中某元素的R代码,亲测好用。原创 2022-10-21 15:48:23 · 6578 阅读 · 3 评论 -
R语言处理数据——删除文件某列中包含某元素的行
删除文件某列中包含某元素的行代码:# 挑选出列名为col中元素为delete的行数del <- which(data$col=="delete")# 删除这些行data_del <- data[-del,]原创 2021-08-24 17:05:23 · 20340 阅读 · 5 评论 -
R语言处理数据——查看某列重复元素及重复次数
查看某列重复元素及重复次数#查看某列大于1的元素library(tidyfst)count_dt(g,POS) %>% filter_dt(n>1)原创 2021-08-25 14:24:41 · 14421 阅读 · 0 评论 -
R语言处理数据——ggplot2去掉网格线和背景色
ggplot2去掉网格线和背景色#ggplot2去掉网格线和背景色+ theme_bw() + theme(panel.grid.major=element_line(colour=NA), panel.background = element_rect(fill = "transparent",colour = NA), plot.background = element_rect(fill = "transparent",colour = NA),原创 2021-08-25 14:25:33 · 13648 阅读 · 1 评论 -
R语言计算Roger遗传距离
R语言计算遗传距离遗传距离是什么,怎样衡量遗传距离的计算Roger遗传距离解决过程关于一些弯路遗传距离是什么,怎样衡量遗传距离指个体、群体或种之间用DNA序列或等位基因频率来估计的遗传差异大小。衡量遗传距离的指标包括用于数量性状分析的欧式距离(D),可用于质量性状和数量性状的Gower距离(DG)和Roger距离(RD),用于二元数据的改良Roger距离(GDMR)、Nei&Li距离(GDNL)、Jaccard距离(GDJ)和简单匹配距离(GDSM)等。参考链接遗传距离的计算Roger遗传原创 2021-04-02 17:47:03 · 2892 阅读 · 5 评论 -
R语言处理数据——快速将多列数据首尾相连成一列
快速将多列数据首尾相连成一列代码如下: data <- c(indv[,n]) for (j in a:b) { data <- c(data,indv[,j]) }原创 2022-04-20 10:49:10 · 5370 阅读 · 1 评论 -
R语言处理数据——生成随机数
生成随机数#如下连续生成16组1:3的随机不重复整数(每次3个),存储至repl中:repl <- NULLfor(x in 1:16) {repl <- c(repl, sample(1:3, 3, replace = F))}原创 2021-08-25 14:13:12 · 2937 阅读 · 0 评论 -
R语言处理数据——查看数据缺失位置及替换
查看数据缺失位置及替换#查看geno.1中缺失所在列which(colSums(is.na(geno.1))==T)#查看geno.1中缺失所在行which(rowSums(is.na(geno.1))==T)#用0替换缺失值d[is.na(d)] <- 0#筛选a,b两个character中的不同元素并打印出来setdiff(a,b)...原创 2021-08-25 14:23:04 · 4988 阅读 · 0 评论 -
R语言画图——structure图一页多图
structure图一页多图library(ggplot2)library(grid)library(cowplot)## 我这里是9个文件,要画9张图,画到一页上,且是9行1列的这种ta1 = read.table("fout.2.meanQ")ta2 = read.table("fout.3.meanQ")ta3 = read.table("fout.4.meanQ")ta4 = read.table("fout.5.meanQ")ta5 = read.table("fout.6.me原创 2021-08-25 14:09:21 · 1841 阅读 · 4 评论 -
R语言处理数据——筛选两个文件中某列的相同元素
筛选两个文件中某列的相同元素library(dplyr)# 筛选type1的POS列,和type2两个文件中的BP列的相同元素position <- Reduce(intersect,list(type1chr$POS,type2chr$BP))# 查看相同元素的个数(去重复)length(unique(position))...原创 2021-08-24 17:25:23 · 9512 阅读 · 11 评论 -
R语言处理数据——筛选某列中元素为特定值的行
筛选某列中元素为特定值的行举个例子,我想要筛选出文件中chr列为1-10的行时,可以这样处理:library(dplyr)data_chr <- filter(data, CHROM %in% 1:10)当然可以按之前发过的帖子,删除chr列为11的行:https://blog.csdn.net/weixin_46605479/article/details/119894195...原创 2021-08-24 17:18:36 · 18553 阅读 · 0 评论 -
R语言处理数据——删除指定列
删除指定列## R语言删除某列library(dplyr)## 按索引删除data <- select(data,-3)## 按列名删除单列data <- select(data,-lieming)## 按列名删除多列data <- select(data,-c(lieming1,lieming2))原创 2021-08-25 14:20:44 · 60411 阅读 · 2 评论 -
R语言处理数据——重命名列
重命名列##重命名全部的列是name(data) <- c("NO","name")##但是数据集有点长的时候用name,没办法对单个列##查了一下colnames(data)[2] <- 'newname'原创 2021-08-25 14:11:48 · 8939 阅读 · 0 评论 -
R语言画图——ggplot2画截断柱状图及R语言从图片中取色
R语言画图——ggplot2画截断柱状图及R语言从图片中取色1、ggplot2画截断柱状图(使用的R包:ggbreak)代码如下:##这里是省略y轴110到140之间的部分scale_y_break(c(110, 140), scale = 0.6, space = 0.1, ticklabels = c(200, 400), expand = expan原创 2022-05-03 19:51:41 · 3114 阅读 · 0 评论 -
R语言处理数据——批量读取文件取并集
批量读取文件取并集这里介绍的算是笨办法,适用于文件名字很有规律的情况,另外linux似乎也可以取并集,且比R语言更加方便。代码如下:# 加载一个我常用的数据处理R包library(dplyr)library(data.table) #读大文件很快# 读文件a1 <- fread(paste0("type4_ColB-B73v4.",1,".egwas"),sep = "\t")a2 <- fread(paste0("type4_ColB-B73v4.",2,".egwas"),原创 2021-08-24 17:10:43 · 1336 阅读 · 0 评论 -
R语言处理数据——仅删除全部缺失(全部为NA)的行
仅删除全部缺失(全部为NA)的行代码如下:# 先写成函数的形式,方便调用removeRowsAllNa <- function(x){x[apply(x, 1, function(y) any(!is.na(y))),]}removeColsAllNa <- function(x){x[, apply(x, 2, function(y) any(!is.na(y)))]}data <- removeRowsAllNa(data)# 非函数形式则更简短,其中 x 为 Da原创 2022-04-20 10:34:24 · 4748 阅读 · 2 评论 -
R语言处理数据——画图时加大标题
画图时加大标题##图形文本可分为三类,分别是标题,可以通过title()函数添加;##图形内部文本,通过text()函数实现;##图形周边文本,可以通过mtext()函数实现。#R语言加大标题,普通作图时mtext("dot and line",side = 4,outer = F,col = "purple")#遇到无法用mtext和legend时,例如用plot_grid进行作图添加标题title <- ggdraw() + draw_label(figure.title,原创 2021-08-25 14:22:00 · 4282 阅读 · 0 评论 -
层次聚类分析及代码实现
如果对计算距离矩阵和聚类的算法有特定要求,可以参考下面的参数介绍。3,闵科夫斯基距离:minkowski。4,切比雪夫距离:chebyshev。5,马氏距离:mahalanobis。2,欧氏距离:euclidean。4,最长距离法:complete。1,绝对距离:manhattan。6,蓝氏距离:canberra。7,密度估计法:density。1,类平均法:average。2,重心法:centroid。3,中间距离法:median。5,最短距离法:single。6,离差平方和法:ward。原创 2022-10-21 15:28:41 · 1688 阅读 · 0 评论