![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息学
文章平均质量分 57
realSnowBee
菜鸡
展开
-
找出纳入PRS/GRS计算的SNP是哪些?
PRS之后的一个小问题在计算完PRS之后,如果选择的是全部阈值(或者设定的阈值有多个)的话,PRS_allscore.prisice文件中就可以看到每个阈值对应的p值(即这个阈值下计算的PRS与表型是否显著),和通过这个阈值的SNP的数量。比如我基于候选基因去做GRS,会得到下图,我感兴趣的是10的-6次方下计算所得的PRS,可以看到仅仅纳入了2个SNP(Num_SNP)。如果我想知道这两个SNP是谁?????首先,这两个SNP是即在base中的p值小于10的-6次方,又存在于我们给的targe原创 2021-03-31 13:54:29 · 975 阅读 · 0 评论 -
plink - 关于提取某一个特定的SNP
一、 查看某一个snp的基因型频率plink --bfile file --snp rs10402893 --freq --out rs10402893 --noweb如果要计算全部snp频率则去掉“–snp rs10402893”命令就好二、 计算某一个snp是否符合哈迪温伯格检验检验:跟上面计算基因型频率类似,不过是将 --freq 改成 --hardyplink --bfile file --snp rs10402893 --hardy --out rs10402893_hw --nowe原创 2020-06-22 22:01:23 · 8190 阅读 · 0 评论 -
GWAS - 基因型与表型的关联分析流程
这里介绍的SNP数据与单一表型的相关分析流程一、准备plink文件ped和map文件转换为bed、fam、bimplink --file mydata --out mydata --make-bedmydata为ped和map的文件名,不需要加后缀make-bed表示生成plink可以处理的二进制文件二、准备表型文件表型文件.pheno 前两列是FID and IID,第三列是表型Phenotype。如果准备了表型文件,那么运行plink的同时会忽略原来 .fam 里的表型。假如有多种表原创 2020-06-21 00:19:26 · 17469 阅读 · 4 评论 -
GWAS - PRS多基因风险评分计算学习笔记
一、安装PRSice(mac版)经试验我觉得直接从git hub中下载对应的安装包是最快的:https://github.com/choishingwan/PRSice,下载之后解压,解压文件如图所示PRSice_mac为软件的运行脚本PRSice.R是执行脚本的封装TOY开头的是数据集,分为BASE和TARGET两部分*接下来可以先用这个数据集测试一下跟plink的安装一样,打开terminal,cd到解压的文件夹,./PRSice_mac如果显示下面的画面表现为安装成功:之后下载R原创 2020-06-05 12:49:11 · 8890 阅读 · 7 评论 -
GWAS - plink文件类型
自己的学习笔记,欢迎各路大神批评指正plink文件类型Plink常见格式有五种:ped,map,bed,fam,bimPLINK接受VCF文件作为输入,但在PLINK中使用的首选格式是带有结尾.ped(和.map)的文件,以及带有结尾.bed(+ .bim + .fam)的文件( ped 和 map 是一组的,bed fam bim 是一组的。因为Plink指令是一对一对识别,例如.ped文件一定要有配对的名字.map文件,一对起来才能运行,名字要保持一致)一般我们提出来了SNP的文件为 .v原创 2020-06-05 12:47:55 · 4260 阅读 · 0 评论 -
GWAS - plink介绍与安装(Mac)
此教程写给像博主一样的小白,欢迎各路大神批评指正GWASGWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位。简单来讲,就是找出基因中哪些序列变异(SNP)与疾病相关。即就是统计一个数,找出与表型最有显著性意义的那些基因(位点)。分析方法有:逻辑回归(表型数据为二元);线性回归(表型数据为连续性变量);表型数据正态分析(如果不是正态分布,需转换处理为正态分布)。R包、plink和EMMAX都可以做GWAS,但是据说后两者做GWAS更快,更容易写出原创 2020-06-05 12:46:13 · 5608 阅读 · 4 评论 -
GWAS - plink提取染色体位置范围内的SNP位点
一、首先学会打开文件写给像我一样的小白,如果你手头有bim、fam等文件,怎么查看呢?双击是不行的!!!!首先打开terminal,cd到文件所在的目录,然后使用vim命令:cd /Users/limingzhu/Downloads/sge_genedata vi xxxxx.bim 其中,文件位路径只需要直接选中文件夹,并且拖到terminal中就可以了!!二、plink命令与文件格式:–bfile 、 --file 和 --tfile使用–bfile 、 --file 和 --tfile原创 2020-06-04 23:25:19 · 7418 阅读 · 2 评论 -
R-下载某一条通路的所有基因名字(KEGG)
实例:如何拿到KEGG数据库中多巴胺通路相关的基因集一、确定目标通路打开KEGG选择pathway,在搜索框前输入物种,框内填入关键词。筛选结果显示仅有hsa04728符合我们的研究目的二、下载hsa04728通路中的全部基因##1.安装R包KEGGREST首次安装时电脑可能会显示与当前R语言版本不配,可以从bioconductor 的官网下载安装if(!requireNamespace("BiocManager", quietly = TRUE)) install.pac原创 2020-06-04 23:23:28 · 12437 阅读 · 8 评论