R
可爱的小垃圾
个人代码笔记,欢迎交流~
展开
-
3种相关分析
R里面做相关(library())的话,通常会见到这三种不同的相关方法,用不同的方法得出来的结果是不一样的,所以总结一下,什么时候该用什么方法。pearson (皮尔逊相关)spearman (斯皮尔曼相关)kendall (肯德尔相关)R:library(dplyr)stats_temp_k = pcor.test(X,Y, Z,method=“kendall”)# Z is the controlling variblesMatlab:一 、皮尔逊相关性在统计学中,皮尔逊相关系数( P原创 2021-10-19 19:45:41 · 3890 阅读 · 0 评论 -
R-画ROC曲线
简单代码:library("pROC")data(aSAH)# Build a ROC object and compute the AUC, draw ROC, print AUC and the best THRESHOLDSroc(aSAH$outcome, aSAH$s100b, plot=TRUE, print.thres=TRUE, print.auc=TRUE)#aSAH$outcome is the ground truth lable;aSAH$s100b is the predi原创 2021-03-26 11:09:07 · 186 阅读 · 0 评论 -
R-T检验代码
shapiro.test(high) #p>0.05具有正态性bartlett.test(x~group)#方差齐性检验# 方差齐性检验检验结果# Bartlett test of homogeneity of variances# data: x by group# Bartlett's K-squared = 0.0066764, df = 1, p-value = 0.9349 ## 接近1表明方差齐#方差齐:var.equal = T#方差不齐,var.equal = F原创 2021-03-23 10:29:48 · 738 阅读 · 0 评论 -
R语言画图坐标轴加箭头
#R语言坐标轴加箭头arrows(100, 0, 105, 0, length=0.1)arrows(0, max(y), 0, max(y)+0.1, length=0.1)原创 2021-03-22 11:52:06 · 2342 阅读 · 0 评论 -
debug-Error: Unknown graphics device ‘‘
使用ggsave函数保存图片的时候,遇到了下面这个错误:Error: Unknown graphics device ''解决了之后,做个笔记帮大家解决问题。这个问题的原因就是我们用的存的图片名字没有带后缀,注意ggsave里面想要存的图片名字一定要带上后缀,否则该函数会报错。错误代码 results_png_name<-'outlier example' p <- ggsave(results_png_name, plot = p_figure, dev原创 2021-03-09 19:48:23 · 1138 阅读 · 0 评论 -
在Mac上的Rstudio中安装package
mac 因为基于unix操作系统,所以可以在上面部署一些只能在Linux下用的软件。在mac上面的Rstudio安装软件包通常分为3种。这里以“extrantsr”为例,介绍 三种安装软件包的方式CRANdevtoolinstall.packages("devtools")library( devtools )devtools::install_github("muschellij2/extrantsr")github下载手动安装a.搜索希望下载的软件包extrantsr,并原创 2021-03-09 16:13:19 · 1695 阅读 · 1 评论 -
R语言函数trainControl
所属package:carert作用:控制train函数的计算差别,其实就是让 train参数寻优的一系列设置。示例和简单参数解释:fitControl = trainControl(method = "LOOCV", number = 10, classProbs = TRUE, summaryFunction = multiClassSumma原创 2021-03-09 16:12:10 · 3829 阅读 · 0 评论 -
R语言-函数multiClassSummary中返回的各个metric的意义
函数multiClassSummary的介绍在上一篇博文(R语言函数-multiClassSummary)中已经介绍过了。这篇文章主要记录一下这个函数返回的各种metric的含义,以后大家了解这个函数和自己以后使用。同时也是一个理解机器学习中各个metric的机会。logLoss:loss函数取对数,用prediction和object值求得的loss function的对数。AUC:使用pROC:roc函数计算的ROC曲线下的面积。prAUC :使用MLmetrics::PRAUC函数计算的AUP原创 2021-03-09 16:10:56 · 447 阅读 · 0 评论 -
R函数-ggarrange
package:ggpubr作用在同一页面上不重叠排列多个ggplot。包装plot_grid()。与标准的plot_grid()相比,可以在多个页面上安排多个ggplot。也可以为多个plot创建一个通用的唯一的图例。实例:当我们有多个plot想要画到同一张画布上面,组成一张大图的时候其中p3,p2,p1都是子plot。library(ggpubr)p_all <- ggarrange(p3, p2, p1, labels = c("A", "B"原创 2020-12-09 10:00:49 · 4951 阅读 · 0 评论 -
R语言函数-image
package:graphics作用:第一个作用可以把一个矩阵画成一张图,矩阵值为图像强度。示例:用image函数可视化了一个2D高斯低通滤波器View(large_venous_filter) image(large_venous_filter)矩阵数据如下画图如下:...原创 2020-11-20 18:22:55 · 4057 阅读 · 0 评论 -
R语言函数-lm和summary
运行代码 relation <- summary(lm(formula = Y~X))可得到relation拟合函数:y=ax+bIntercept: bX: a对应的四个变量为Estimate | Std. Error| t value| Pr(>|t|)估值 |标准误差 | T值 | P值这样,我们可以稍微这样总结一下:T检验是检验解释变量的显著性的;R-squared是查看方程拟合程度的;F检验是检验方程整体显著性的;也就是说R-square原创 2020-11-18 23:45:01 · 5022 阅读 · 0 评论 -
R函数-computeDVARS
所属package:ANTsR作用:计算fMRI数据的DVARS,作为数据质量控制的指标。DVARS反应的是两个时间点的图之间的差别。根据源代码,可以发现,第一个数据为均值,后边的数据是后一个数据减前一个数据的平方的均值开平方应用场景:在fMRI经过motion correction之后,可以对比矫正前后的DVARS,来看矫正的效果。这个图可以看不出两个问题,1,如果黑色圆点点落在y=x线上方说明矫正效果好,矫正之后两个时间点的数据差距减小了;2,如果数据横纵坐标比较大,证明两个时间点的数据有相当大原创 2020-11-17 16:55:14 · 247 阅读 · 0 评论 -
R语言函数-grep
所属package:base作用:查找字符变量里面是否存在某些特定字符应用场景:字符查找,最简单的,无正则表达式的查找。key_word ='KTH'text_temp = 'cbhebkth'grep(key_word,text_temp)说明:pattern 有很多形式,可以使用正则表达式可以实现一一些特殊需求的查找。下面是一个简单例子,temp<-grep("^thcd",temp_text,value=T)#查找开头为'thcd'的字符下面是正则表达式的一些符号和意义:原创 2020-11-17 12:21:26 · 2781 阅读 · 0 评论 -
R语言函数-tolower
所属package:base作用:将字符变量变成小写应用场景:字符查找的时候,如果希望不区分大小写匹配的话,就可以使用这个函数先讲需要需要查找的字符和文件全变成小写,这样的查找就是不区分大小写的查找。写如下代码是无法查找到结果的,key_word ='KTH'text_temp = 'cbhebkth'grep(key_word,text_temp)使用tolower便可以实现不区分大小写查找功能key_word = tolower('KTH')text_temp = tolower原创 2020-11-17 12:09:19 · 1155 阅读 · 0 评论 -
R语言函数-multiClassSummary
所属package:‘MLmetrics’作用:就算一系列分类结果的度量标准(metric)简介:multiClassSummary computes some overall measures of for performance (e.g. overall accuracy and the Kappa statistic) and several averages of statistics calculated from “one-versus-all” configurations. For原创 2020-11-13 19:15:13 · 438 阅读 · 0 评论 -
R语言函数-twoClassSummary
所属package:caret作用:计算两分类的灵敏度,特异性和ROC曲线下面积。应用场景:作为caret中trainControl中的summaryFunction的input# 划分的重数,repeats确定了反复的次数fitControl = trainControl(method = "LOOCV", classProbs = TRUE, summaryFunction = twoCla原创 2020-11-13 19:06:29 · 415 阅读 · 0 评论 -
R语言函数-ifelse
所属package:base作用:返回一个与Tess 图相同的值,该值的填充取决于test的元素是真还是假,从yes活着no中选择元素。示例:a = 1b = 2test <- ifelse(a>=b, a, b)test选择a,b中更大的那个数。当然这么简单的功能不用这么复杂的函数,通常情况下判断条件是很复杂的逻辑运算。比如下面这段代码,结合函数all, %in%,colnames实现复杂的逻辑:test <- ifelse(all(lev %in% colnames(原创 2020-11-13 17:23:10 · 1708 阅读 · 0 评论 -
R语言查找data.frame里面是否包含某些变量。
功能:查找某个data.frame的列名里面是否有某些变量名(是否有某些变量)一个简单的写法:比如lev是一个含有多个字符的变量,直接用下列代码就可以查找,data中是否包含这些字符变量。lev %in% colnames(data)如果全部变量在data中返回true如果变量不在数据中,返回false...原创 2020-11-13 17:00:28 · 3869 阅读 · 0 评论 -
R语言函数stop
所属package:base作用:停止执行当前表达式,并且输出函数中的字符。示例:a = 1b = 1if (a == b) stop("there is a mistake")应用场景:通常用作判断结果是否正确,并继续执行函数中。比如下面一段实际代码中实现的功能是如果预测的类别数量与truth的类别数量不同,报错。 if (!all(levels(data[, "pred"]) == levels(data[, "obs"]))) stop("levels原创 2020-11-13 16:40:10 · 5042 阅读 · 0 评论 -
R语言函数all
所属package:base作用:判断逻辑向量中是否所有值都为true示例:levels(data[, "pred"])levels(data[, "obs"])levels(data[, "pred"]) == levels(data[, "obs"])all(levels(data[, "pred"]) == levels(data[, "obs"]))应用场景:想判断两个数据是否有相同的level的时候,比如我们在machine learning中就可以首先通过简单判断原创 2020-11-13 16:31:10 · 2331 阅读 · 0 评论 -
R语言多package函数重名解决方案
help('train')可以看到右侧help里面显示,多个工具包下都有这个函数。如果直接用,有可能因为函数名冲突,无法完成我们想要完成的功能。processing_time1 <- proc.time() # record a patient processing time ANN_pre = train(new_EZ_NIZ, EZ_NIZ_Class, method原创 2020-11-05 20:04:54 · 1761 阅读 · 0 评论 -
R函数 -colnames
作用:获取table的表名使用小技巧:配合grep函数查找该table中是否包含某个名字的列应同场景:想要批量取table中的变量时,常常因为拼写错误遇到下列错误。但是这个错误只能提示我们有的列不存在,但是具体是哪个变量不存在并不知道。当我们的应用场景是多于5个左右的变量时,一个一个检查就比较浪费时间。所以要是能监测到具体哪个变量有问题,针对性检查拼写,会事半功倍。1,直接办法用下列代码,可以检查逐个每个变量是否存在。grep('kk',colnames(merge_self))如下列两个测原创 2020-10-28 01:53:27 · 10910 阅读 · 0 评论 -
R工具包加载错误
R安装工具包之后想要加载这个工具包出现如下错误:rror: package or namespace load failed for ‘ggpmisc’ in loadNamespace(i, c(lib.loc, .libPaths()),解决方法可以试一下如下:install.packages(“munsell”)原创 2020-10-22 10:35:39 · 810 阅读 · 0 评论 -
R语言批处理查找pdf中的关键字
两个package:pdftools,pdfsearch结果:all_record,里面装了文件名(filename),关键字(keyword),页码(page_num),行数(line_num),语境(line_text),token_text########################################################################################################## serch key_word in pdf#原创 2020-10-15 18:13:00 · 595 阅读 · 0 评论 -
R新建空矩阵循环放数据
test <- array('NA',dim=c(4,1))# 新建空矩阵置NAfor (i_variable in array(1:4)) { test[i_variable,1] <- i_variable}原创 2020-10-13 10:51:22 · 889 阅读 · 0 评论 -
R语言,函数里面保存图片
因为使用常规的tiff()+dev.off()不能在函数中保存图片。在函数中保存ggplot2绘制的图像的方法:使用ggsave。file_name = paste(marker,’-’,group,‘MWU.tiff’)ggsave(file_name, plot = p, device = NULL, path = save_path,scale = 1, width = NA, height = NA, units = c(“in”, “cm”, “mm”),dpi = 300, limits原创 2020-10-08 09:00:29 · 3219 阅读 · 0 评论 -
R 画 violin图
library(ggplot2) #注释:package在使用之前需要调用Fontsize_defined = 20;#字体大小results_png_path = file.path(save_path,paste(marker,'-',group,'.tiff'))tiff(file = results_png_path,bg="transparent")eval(parse(text = sprintf("p<-ggplot(temp_data, aes(x = %s, y = %s).原创 2020-10-06 20:31:35 · 772 阅读 · 0 评论