![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言
文章平均质量分 84
Gremmie2003
南京医科大学,生物信息学的学生,热爱编程和计算机,学习永远不会停下脚步
展开
-
[TWAS]individual-level implementation of PrediXcan(实现PrediXcan)
(下面,映射是指将基因型变异与模型变异相匹配的实现规则。:path to a sqlite(一个轻量级别数据库) file containing prediction models包含预测模型的sqlite文件的路径.must be specified with this argument.可选的。原创 2023-07-31 17:25:51 · 614 阅读 · 0 评论 -
[GWAS]基于plink的亲缘关系质控
这里我们使用的是ped和map格式,如果ped文件中有表型数据(第六列),如果想指定表型数据,就使用–pheno参数,包括三列:家系,个体,表型值。这里讲亲子关系的移除其实不是必须要的,比如我们分析的群体里面有亲子关系的个体,想要进行分析,不需要做这一步的筛选。这里的文件是bed二进制文件,不方便查看,我们将其转化为ped文件和map文件。本篇我们要对一下具有亲子关系的个体进行过滤,然后计算类似于IBS的结果。,两个个体拥有相同的等位基因(不一定来源以同一祖先)。接着我们提取Z1大于0.9的个体。原创 2023-07-17 01:57:21 · 1235 阅读 · 0 评论 -
[GWAS]杂合度质控
在一群自然群体种,基因型个体的杂合度过高或者过低都是不正常的,我们需要根据杂合度来进行过滤。plink有个特点,所有的过滤标准,都可以生成过滤之前的文件,然后可以手动过滤,也可以用参数进行过滤。我们采取的做法是删除样品杂合率平均值中偏离±3 SD(sd就是标准差)的个体。去掉这两个个体之后,先对数据进行清洗,去掉引号,然后提取家系合个体ID。非自然群体中,比如自交系,杂交种F1,这些群体不需要过滤杂合度。我们从结果可以看出,这两个个体杂合度在3倍标准差之外。首先我们来查看哪些个体在3倍的标准差之外。原创 2023-07-17 01:28:53 · 463 阅读 · 0 评论 -
[GWAS]基于plink的(hardy-weinberg)哈温质控
一个群体是否符合这种状况,即达到了遗传平衡,也 就 是 一 对 等 位 基 因 的 3 种 基 因 型 的 比 例 分 布 符 合 公 式 :p2+2pq+q2=1,p+q=1,(p+q)2=1.基因型MM的频率为p2,NN的频率为q2,MN的频率为2pq。而哈温平衡检验,则是根据基因型推断出理想的(AA,AT,TT)的分布,然后和实际观察的进行适合性检验,然后得到P值,根据P值进行筛选.即P值越小,说明该位点越不符合哈温平衡。对于一个位点"AA AT TT",其中A的频率是基因频率,AA为基因型频率.原创 2023-07-16 23:41:40 · 373 阅读 · 0 评论 -
[GWAS]plink基因数据性别质控并用R作图
本篇主要针对人类性别的信息的质控,主要是根据性染色体上SNP的比值,判断性别,然后把性别错误的个体去掉或者更改性别信息.对其他的物种参考意义不大,因为在动物中一般会把性别信息的SNP去掉。然后将相关错误的ID提取出来(家系ID,个体ID),之所以提取家系ID和个体ID,因为plink有参数remove可以根据ID进行筛选.我们从图中可以看出,woman中,大部分都是小于0.2的,有一个为1,这个应该是错误的ID。plink自身也有–check-sex的参数,所以操作一下,留下笔记。接着我们检查性别冲突。原创 2023-07-16 13:49:50 · 1785 阅读 · 0 评论 -
[GWAS]plink数据格式的转化和缺失质控
plink中一些数据文件的解读以及转化,基因数据的缺失质控原创 2023-07-16 00:58:38 · 716 阅读 · 0 评论 -
选择排序概览
选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上,则它不会被移动。选择排序每次交换一对元素,它们当中至少有一个将被移到其最终位置上,因此对n个元素的表进行排序总共进行至多n-1次交换。在所有的完全依靠交换去移动元素的排序方法中,选择排序属于非常好的一种。希望能帮到你。原创 2023-05-27 12:08:50 · 522 阅读 · 0 评论 -
插入排序概览(Java+R代码)
我们接着上篇文章的冒泡排序来理解插入排序。原创 2023-05-27 11:53:20 · 827 阅读 · 0 评论 -
冒泡排序概览(java+R_优化以及双向冒泡代码)
排序的含义:对含有多个记录的文件进行整理,最终使得各个记录按关键字递增( 或递减)的次序排列起来。这个整理的过程称为排序。原创 2023-05-27 10:45:44 · 1240 阅读 · 0 评论 -
R—读取数据(导入csv,txt,excel文件)
read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。一般这些参数足够使用,但是当导入大量数据时可能吃不消,下面一些参数可能有所帮助(其他用途当然也可以)。读取大量数据时,在不加内存的情况下预先分配内存是很好的选择。首先reaadLines函数可以获得数据的行数(注意L为大写)。先判断数据量。:返回一个向量。当读取的数据为同一模式时,scan是最佳方式,默认读取数值型数据。若想读取其他类型,使用what=参数指定。原创 2023-04-24 18:52:02 · 7321 阅读 · 0 评论 -
[R语言]正态分布
在随机收集来自独立来源的数据中,通常观察到数据的分布是正常的。这意味着,在绘制水平轴上的变量的值和垂直轴中的值的计数时,我们得到一个钟形曲线。曲线的中心代表数据集的平均值。在图中,百分之五十的值位于平均值的左侧,另外五十分之一位于图的右侧。统称为正态分布。R有四个内置函数来生成正态分布。它们在下面描述以下是上述函数中使用的参数的描述x- 是数字的向量。p- 是概率向量。n- 是观察次数(样本量)。mean- 是样本数据的平均值,默认值为零。sd- 是标准偏差,默认值为1。原创 2022-12-16 12:56:41 · 15454 阅读 · 0 评论 -
[R语言]RMarkdown: 入门与操作
RMarkdown为我们的数据分析创建一个清晰美观的报告,它能够包含代码,图,表,说明,查看的人能够很清楚地理解。RMarkdown利用Markdown的语法,能够被方便的转成其他类型(如html或pdf)的文件。如果要用RMarkdown,首先要下载R和RStudio。R Markdown是通过R语言制作动态文档的文件格式。R Markdown文档编辑需要 rmarkdown包,rmarkdown安装需要RStudio编辑器环境,但是你可以以github途径来下载rmarkdown,并安装。原创 2022-12-14 09:39:06 · 4697 阅读 · 0 评论 -
[R语言]手把手教你如何绘图(万字)
还不会R语言绘图?科研写作还在靠抄?快点进来学习吧,保姆级教程原创 2022-12-13 23:29:32 · 11123 阅读 · 0 评论 -
统计学中关于自由度的详细解释以及求平均值为什么消耗自由度1
首先我们要了解自由度是什么自由度在本科教学中一般都不会过度涉及,因为它给老师和学生都带来了很大的困扰,它本身也有一些历史遗留问题,有很多人给出了很多不同的出发点和解释,比如1946年“自由度就是二次型的秩”,1967年“自由度就是一种和尼曼皮尔森维尔克斯自然比或最大自然比的概念”,1973年“自由度就是参数空间维度的差值”,2015年“自由度就是在估计一个信息时其他独立信息的总量”,now“自由度就是在估计中,可自由变换值的数量”首先我们举个例子:我们大家都想实现财富自由,这里的财富自由主要指的就是能原创 2022-12-04 20:30:50 · 1776 阅读 · 0 评论 -
[R]第二节 练习一关于数值向量
方案一可以解决一部分的这类问题,但是这种方案需要你的全集不会有缺失值非数这样的其他不在全集里的事件。复制是指的是对整个向量进行复制。seq(from,to,length.out=by)表示生成一组从from到to的数量为num的数。rep(1:4, each = 2, length.out = 4) #最后输出向量的长度为4。rep(1:4, each = 2) #对向量(1,2,3,4)中的每个元素复制两次。函数形式:rep(x, time = , length = , each = ,)原创 2022-11-17 09:29:45 · 590 阅读 · 0 评论 -
[R]第二节 对象介绍与赋值运算
R 创建、控制的实体(entity)称为对象(object)。向量(vector)矩阵(matrix)数组(array)数据框(data frame)列表(list)因子(factor)函数(function)通过以上实体定义的更为一般性的结构(structures)原创 2022-11-15 23:50:12 · 1391 阅读 · 2 评论 -
[R]第一节 初始R语言
对于有特殊含义的字符,可以采用逃逸符号:双引号或者单引号(一般适用于有语法含义的关键字和有特殊含义的字符,如if,for,function等)为了得到任何特定名字的函数的帮助,如solve,可以使用如下命令。在大多数R平台中,你可以通过运行下面的命令得到HTML格式的帮助。** save.image**(file=“yourname”) #在这之前要重新设置工作目录,即用setwd(D:/…> sink(“外部文件”) #把所有输出结果从控制台重新定向到外部文件当中。查看已定义的变量可以使用ls()函数。原创 2022-10-19 19:50:53 · 971 阅读 · 2 评论