R
文章平均质量分 57
小孔乘象k
这个作者很懒,什么都没留下…
展开
-
中心极限定理 central limit theorem
中心极限定理 central limit theorem中心极限定理是很多统计的基础,解释自然界中大多数数据属于正态分布,这使得正态分布在统计学中的应用非常广泛。「为什么中心极限定理能够解释数据属于正态分布,接下来我们就以不同类型的原始数据进行证明。」even if you’re not normal,the average is normal中心极限定理指的是给定一个任意分布的总体(除了无法计算均值的分布以外)。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值原创 2021-02-16 15:50:09 · 4642 阅读 · 0 评论 -
R语言-出图时的中英文字体解决方案
目录方案1- showtext方案2-Cairo在某些时候,需要在 R 画图中添加中文,但是默认情况下,R 对中文的支持不好。方案1- showtext这里推荐一个showtext的 R 包。如果需要将含有中文字体的图形保存为 pdf 文件,可以使用下面讲到的方案,最新版的showtext已经支持了ggplot2,推荐使用此种方案。这样,在你写的 R 代码中,开头添加:library(showtext)showtext_auto(enable=True) # 表示之后用上同样的字体fon原创 2021-02-15 22:08:16 · 5447 阅读 · 2 评论 -
统计学三大相关性系数:pearson,spearman,kendall
在文献以及各种报告中,我们可以看到描述数据之间的相关性:pearson correlation,spearman correlation,kendall correlation。它们分别是什么呢?计算公式?怎样用R语言简单实现计算呢?本文一一介绍~建议前期阅读:协方差与相关系数-“傻傻”也能分清总的来讲,三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示原创 2021-02-14 12:16:45 · 3773 阅读 · 1 评论 -
R语言:无法精确计算带连结的p值
当你在使用cor.test,wilcoxon.test等这些函数时,不知道有没发现一个exact参数,以及是否遇到过无法精确计算带连结的p值这个warning。如果有,请往下看。这个问题应该是很常见的,《非参统计》书里写道:数据中有相同的数字,成为结(tie),结中的秩为按照升幂排列后位置的平均值,如果结多了,零分布的大样本公式就不准了,因此要做修正。”Example对于wilcox.test,是基于样本来自连续对称分布的总体,所以本不应该有相同的值,但是由于四舍五入,连续变量观测到的值都是离散原创 2021-02-14 12:01:12 · 16226 阅读 · 5 评论 -
ggplot2 进阶--多重color/fill scales
ggplot2 迄今是R里最受欢迎画图package,个人感觉最主要的一个因素就是layer叠加的语法结构(图层),类似于photoshop的图层概念。而且,ggplot2的变量映射aes也是很厉害。那么,就有个局限,每个变量只能映射一种scale,那怎么样在同一个图中出现两种或者多种color/fill scale的映射呢?ggnewscale这个包你值得拥有!github链接使用方法】其实很简单,见如下说明# 直接在需要增加scale的geom之前加如下代码?new_scale#格式:原创 2021-02-07 20:21:37 · 3440 阅读 · 0 评论 -
markdown-语法记录
目录一、Markdown 是什么?二、印象笔记里 Markdown 有什么特点?三、如何创建 Markdown 笔记?四、印象笔记 Markdown 笔记支持哪些语法?设置分级标题一级标题二级标题三级标题四级标题五级标题六级标题加粗文本斜体下划线删除线添加分隔线插入目录引用文本添加符号列表或者数字列表添加待办事项插入链接插入图片插入表格插入图表插入行内代码或代码块插入数学公式插入流程图插入时序图插入甘特图设置目录五、印象笔记 Markdown 支持什么快捷键?本文内容来自印象笔记官网,版权归印象笔记官方原创 2020-07-06 22:08:21 · 727 阅读 · 0 评论 -
ggplot-易忘知识点手册
目录点线类型点线类型shape = xlty = x可以使用代码展示library(ggpubr)show_point_shapes() #显示点的形状(ggpubr包内的函数)show_line_types() #显示线条类型(ggpubr包内的函数)type = x # 类型原创 2020-07-05 22:40:44 · 228 阅读 · 0 评论 -
R-常见error及其可能原因--笔记
目录)常见error及其可能原因(自用)ggplot 类数据操作类更新于 2019.05.11常见error及其可能原因(自用)以下全部是自己实际过程中遇见过的,现收集起来,方便学习使用,大家有遇到其他的,我也可以收集并更新进这里~ps: 就算你看懂报错的 error 信息,但是也可能找不到具体哪一步错了,所以勿喷“error信息已经说明了blabla之类的话”ggplot 类Q: ...原创 2019-05-11 16:23:01 · 19843 阅读 · 7 评论 -
R包-信息整理--笔记
目录)R包信息(自用)统计分析类画图类其它R包冲突更新于 2019.05.11R包信息(自用)部分包含了 examples,方便学习使用统计分析类library(psych) # pcor.test 偏相关分析library(Hmisc) # cut2 分bin,比如 expression quantiles画图类library(grid) # viewport print自定义...原创 2019-05-11 15:53:38 · 460 阅读 · 0 评论 -
运算函数以及符号--笔记
文章目录)算术运算符参考链接2019.05.11 更新算术运算符^或** 乘方,求幂值A%%B 取余,模运算A%/%B 整数除法== 严格等于,判断是否相等!x 不等于xx|y 或,&或|比较两个向量的所有元素x&y 与sign() 判断正负&&或|| 逻辑计算操作,只比较两个向量的第一个元素xor ...原创 2019-05-11 15:32:47 · 457 阅读 · 0 评论 -
R语言-爬虫rvest
爬虫就是批量自动将网页的内容抓取下来。用任何语言做爬虫必须要了解的就是网页语法,网页语言无非就是HTML,XML,JSON等,因为正是通过这些我们才能在网页中提取数据,过多的就不再描述,大家可以自行参考大量的资料,大多数语法都是树形结构,所以只要理解了,找到需要数据的位置并不是很难。用R语言制作爬虫无非就是三个主要的包。XML,RCurl,rvest,这三个包都有不同的主要函数,是R语言最牛的网络爬虫包。了解htmlHTML框架简单说就是任何HTML网页文件中都会包含的基本代码内容。如果我们打算写一个原创 2020-11-08 18:34:32 · 4797 阅读 · 0 评论 -
R-日常使用tips
目录利用提取R自带的数据集持续更新last update:202009利用提取R自带的数据集输出R内置数据集data()data(package = ‘datasets’)任意一个包自带有哪些数据集,可以有命令:data(package = ‘包名’)查看R所有包的数据情况,从下面参数all.available = TRUE也能猜出来。data(package = .packages(all.available = TRUE))提取数据方法:mydat <- data(“原创 2020-09-05 15:17:18 · 599 阅读 · 0 评论 -
R-眼前一亮的绘图
神奇的R-神奇的图忘记了那里扒下来的代码了,如果原作者看到了,告诉我哈,我会附上原文链接library(TeachingDemos)data <- rbind(c(80394, 32903, 13.2), c(82560, 36230, 13.8), c(85213, 26921, 10.8))faces2(data, which = c(3, 14, 12), labels = c("北京", "上海", "天津"), ncols = 3)黑客图nx = 100ny = 80原创 2020-07-06 17:16:37 · 234 阅读 · 0 评论 -
R-GenVisR包-绘制snp突变landscape-瀑布图-参数详解
绘图文件,此R包对输入文件格式进行了规定,R包可以通过搜索列文件名来找出作图所需要的信息。文件格式可以为MAF、MGI和custom(自定义文件)三种,每种文件至少包含三列信息,分别如下:MAF必须包含以"Tumor_Sample_Barcode", “Hugo_Symbol”, “Variant_Classification"命名的列;MGI必须包含"sample”,“gene_name”,“trv_type"命名的列;Custom文件必须包含"sample”, “gene”, "variant_原创 2020-07-05 00:15:40 · 3956 阅读 · 0 评论 -
R-ggsci-NCS期刊级别的配色
目录简介使用单独展示 ggsci的配色方案简介官方链接如下:https://github.com/nanxstats/ggsci使用参考官方展示的内容,大部分都是翻译https://nanx.me/ggsci/articles/ggsci.htmlggsci包可以说是ggplot2的一个扩展包,主要的应用是对ggplot绘制的图形提供设定好的配色方案,但同时该包中的配色方案也能够被base或lattice等其它绘图方式所调用。ggsci包的配色方案使用scale_color_palnam原创 2020-07-04 15:44:24 · 3971 阅读 · 0 评论 -
在R使用matlab
与matlab相关的包R.matlab简单读存mat文件,并在R中调用matlabinstall.packages("R.matlab")library(R.matlab)实例如下dat <- readMat(xxxx.mat)print(dat$xx)注意事项读入压缩.mat文件时:Reading compressed MAT filesFrom MATLAB v7, compressed MAT version 5 files are used by default [原创 2020-07-04 15:07:57 · 1967 阅读 · 0 评论 -
R-corrplot包-相关性可视化2
1.8cl.pos图例位置1corrplot(mat_cor,method="ellipse",order="AOE",col=palette_2,2addCoef.col="gray20",addCoefasPercent=TRUE,cl.pos="r",3title="图例在右边",diag=TRUE,mar=c(1,1,1,1))4corrplot(mat_cor,method="elli...转载 2020-07-01 16:59:31 · 1968 阅读 · 2 评论 -
R-corrplot包-相关性可视化
简介:相关图是基于相关系数矩阵绘制的图。通常是将1个变量映射到多个视觉元素,所以看起来很花哨。如果是椭圆:则椭圆的色相对应相关性的正负,颜色深浅对应相关性绝对值大小,越深则绝对值越大。椭圆的形状对应相关性绝对值大小,默认越扁,则相关性绝对值越大。如果是圆,则圆的面积对应相关性大小,如果是扇形,则扇形的弧度对应相关性大小。相关系数:自变量X和因变量Y的协方差/标准差的乘积。也可以反映两个变量变化时是同向还是反向,如果同向变化就为正,反向变化就为负。它消除了两个变量变化幅度的影转载 2020-07-01 16:35:41 · 2539 阅读 · 0 评论