生物信息学
生物信息学
紫霄zixiao
学海有涯,人生无涯
展开
-
shell中for循环变量常见使用场景
在shell脚本for循环使用过程中经常出现非常规使用场景,如在awk的条件语句中、输出文本中变量后有字符等,这些场景中需要对for循环中的变量做处理。希望持续完善。原创 2023-06-13 19:42:34 · 493 阅读 · 0 评论 -
在linux服务器中对R语言中for循环设置多核运行
在R中构建了for循环,由于循环过多,运行速度过慢,且不同循环之间是并行关系,拟通过多核运行可以解决此问题。原创 2023-06-02 15:37:41 · 880 阅读 · 0 评论 -
用GCTA计算亲缘关系矩阵和遗传力
用GCTA计算亲缘关系矩阵和遗传力原创 2022-09-24 20:48:59 · 2226 阅读 · 0 评论 -
群体分层 population stratification
plink群体分层原创 2022-09-24 20:13:16 · 410 阅读 · 0 评论 -
连锁不平衡 LD
简要介绍了r2和D'的差异原创 2022-09-22 10:11:43 · 1067 阅读 · 0 评论 -
PLINK相关性分析,分类变量和连续型变量
LD相关性分析,分类变量和连续型变量单个SNP与表型相关性分析,所有SNP相关性分析原创 2022-09-22 10:07:52 · 2193 阅读 · 2 评论 -
plink遗传数据质控--每个个体QC、每个marker(变异)质控、全基因组关联meta分析QC
plink遗传数据质控--每个个体QC、每个marker(变异)质控、全基因组关联meta分析QC原创 2022-09-20 08:51:17 · 1467 阅读 · 0 评论 -
plink描述性统计--等位基因频率、缺失值
plink描述性统计--等位基因频率、缺失值原创 2022-09-20 08:49:02 · 4293 阅读 · 1 评论 -
Plink数据管理, 筛选个体和变异,合并不同的遗传文件,并附加一个表型
Plink数据管理, 筛选个体和变异,合并不同的遗传文件,并附加一个表型原创 2022-09-20 08:46:09 · 2561 阅读 · 2 评论 -
Plink常见命令 --bfile --freq--recode --make-bed
plink常用文件转换命令原创 2022-09-18 20:41:28 · 3395 阅读 · 0 评论 -
pca绘图
PCA绘图原创 2022-09-18 17:04:13 · 1029 阅读 · 0 评论 -
plink的文件格式
plink文件格式介绍原创 2022-09-09 23:20:29 · 2428 阅读 · 0 评论 -
机械硬盘数据拷贝
机械硬盘数据拷贝原创 2022-08-31 20:02:14 · 606 阅读 · 0 评论 -
R相关在线图书及视频整理
1 R图书及课程1.1 基础知识1.1.1 数据科学中的R语言github网址:https://github.com/perlatex/R_for_Data_Science1.1.2 张敬信-R语言编程:基于tidyversegithub网址:(https://github.com/zhjx19/introR)知乎:https://zhuanlan.zhihu.com/p/1981858881.1.3 R语言进阶笔记——邓飞1.1.4 Computational Genomics with原创 2022-03-17 19:48:09 · 644 阅读 · 0 评论 -
R语言按某一列的值进行合并(提取GO对应的基因)
GID <- data$GID[!duplicated(data$GID)]GO <- matrix(NA,nrow=length(GID),ncol=2)for (i in 1:length(GID)) { a <- data[data$GID==GID[i],] GO[i,1] <- a[1,1] GO[i,2] <- paste(a[,2],collapse = ",")}GO <- as.data.frame(GO)原创 2021-11-20 17:02:38 · 2107 阅读 · 0 评论 -
R语言绘制黑灰图片,如热图、气泡图(用于论文不彩印)
retu <- read.csv("retu.csv",header = T,row.names = 1)retu <- as.matrix(retu)pheatmap(retu,color = c("#d8e3e7", "black"), show_rownames = FALSE)library(ggplot2)KEGG <- read.csv("DXKEGG.csv",header = T)colnames(KEGG)[1] <- "num"colnames原创 2021-11-08 09:24:13 · 1092 阅读 · 0 评论 -
GSEA绘图——R
rm(list=ls())options(stringsAsFactors = F)source("gseaplot_modified.r")path <- "E:/Users/Administrator/Desktop/GSEA/out/HT_LT_GO14.Gsea.1632210488415"replotGSEA(path,"CALMODULIN BINDING")原创 2021-09-24 16:54:03 · 1902 阅读 · 0 评论 -
WGCNA模块与性状展示图
在RStudio中安装加载ggcordevtools::install_github("shinepreventer/ggcor-hou")github网址:https://github.com/shinepreventer/ggcor-hou以下是github中给出的例子library(dplyr)#> Warning: package 'dplyr' was built under R version 3.6.2data("varechem", package = "vegan").原创 2021-07-11 22:11:50 · 2979 阅读 · 3 评论 -
从NCBI中查看已发现的基因可变剪接
1、首先在Nucleotide中输入基因名和物种名2、选择打开以下的连接3、点击 Graphics4、查看已发现的转录本还可以结合转录组测序云平台,查看测序出的可变剪接5、点击Tools查看序列信息此序列为NCBI上提交的反向互补序列...原创 2021-06-19 20:45:37 · 5568 阅读 · 6 评论 -
R语言-根据某一行相同进行合并
由data合并成GOdataGO代码如下:GID <- data$GID[!duplicated(data$GID)] #data第一列去重#GO <- matrix(NA,nrow=length(GID),ncol=2) #提前算好合并成的数据是几行几列,length(GID)行,2列#for (i in 1:length(GID)) { a <- data[data$GID==GID[i],] GO[i,1] <- a[1,1] GO[i,2] <原创 2021-06-01 21:00:41 · 7360 阅读 · 2 评论 -
KEGG_cnetplot绘制基因—通路图(展示想要的通路)——R
以KEGG富集结果为例首先进行KEGG富集分析library(clusterProfiler)de_ekp <- enricher(gene, TERM2GENE = pathway2gene, TERM2NAME = pathway2name, pvalueCutoff = 1, qvalueCutoff = 1)1、展示前5个通路cne原创 2021-05-26 21:39:18 · 23918 阅读 · 3 评论 -
Biopython安装及fasta序列展示
Biopython 教程与手册网址:https://biopython-cn.readthedocs.io/zh_CN/latest/index.htmlwindows安装Biopythonpip install biopython 查看版本信息import Bioprint(Bio.__version__)fasta序列展示先用PyCharm打开或创建一个项目,将fasta文件下载复制到。idea文件中1、查看下载的fasta序列是否在。idea文件内。2、更.原创 2021-04-30 21:33:13 · 614 阅读 · 4 评论 -
差异基因/代谢物KEGG富集柱状图
library(ggplot2)p <- ggplot(gene_dx, aes(x=pathway_name, y=-log10(value)))p + geom_bar(stat="identity", position="dodge", aes(fill=leibie))p + geom_bar(stat="identity", position="dodge", aes(fill=leibie))+coord_flip()p + geom_bar(stat="ident原创 2021-04-23 20:36:14 · 4087 阅读 · 1 评论 -
R语言拆分单元格,以GO为例
将GO拆分成gene2golibrary(stringr)all_go_list=str_split(GO$GO_id,";")all_ONTOLOGY_list=str_split(GO$Go_description,";")gene2go <- data.frame(GID = rep(GO$GID,times = sapply(all_go_list, length)), GO = unlist(all_go_list),ONTOLOGY原创 2021-04-22 20:29:52 · 1487 阅读 · 0 评论 -
转录组的基因相关性分析---R
#读取表达数据,列名是样本名#DEG_expression <- read.csv("DEG_expression.csv",row.names = 1,header = T)DEG_expression <- t(DEG_expression)#进行相关性分析#gene_cor<- cor(DEG_expression)#绘制热图#library(pheatmap)pheatmap(gene_cor,show_rownames = F,show_colnames =原创 2021-04-08 21:47:27 · 6987 阅读 · 10 评论 -
O2PLS(绘制载荷图)--R
##绘制载荷图##gene_loading <- as.data.frame(fit0$W.)meta_loading <- as.data.frame(fit0$C.)colnames(gene_loading) <- c("pq1","pq2")colnames(meta_loading) <- c("pq1","pq2")#添加新的一列,按组学进行归类#Omics <- NA gene_loading <- cbind(gene_loading[,1:原创 2021-04-02 21:13:42 · 3643 阅读 · 0 评论 -
O2PLS(绘制基因和代谢物前15个载荷值图)--R
fit0 = o2m(X = X, Y = Y, n = 2, nx = 2, ny = 2)#模型返回数值讲解##Joint X scores:fit0$Tt##Joint X loadings: fit0$W.##Joint Y scores:fit0$U##Joint Y loadings: fit0$C.#gene_looding <- as.data.frame(fit0$W.)meta_looding <- as.data.frame(fit0$C.)原始数据原创 2021-04-02 19:35:19 · 3810 阅读 · 2 评论 -
代谢与转录联合分析之九象限分析 -R
#九象限分析#数据准备相关性分析的r值与p值#导入相关性分析的p值和r值#r.spearman <- read.csv("r.spearman.csv",header = T,row.names = 1)metaGeneCor.p <- read.csv("metaGeneCor.p.csv",header = T,row.names = 1)#转换数据类型为matrix#r.spearman <- as.matrix(r.spearman)metaGeneCor.p &原创 2021-03-30 21:01:24 · 5153 阅读 · 13 评论 -
R绘制九象限图
数据该数据包含基因与代谢物的logFC,基因与代谢物所持九象限的位置第5象限没有,但是公司给的报告中显示黑色。下面是自己创建的第5象限数据,目的是把第5 象限涂黑data1_2_4 <- read.csv("data1_2_4.csv",header = T)data3_7 <- read.csv("data3_7.csv",header = T)data6_8_9 <- read.csv("data6_8_9.csv",header = T)data_1 <- d原创 2021-03-29 11:51:49 · 4494 阅读 · 0 评论 -
皮尔逊相关分析——代谢组与转录组联合-R语言
数据导入Rstudiodx <- read.csv("dx.csv",header = T,row.names = 1)gene <- read.csv("gene.csv",header = T,row.names = 1)转换数据类型gene1 <- as.matrix(gene)dx1 <- as.matrix(dx)就某个基因与代谢物进行相关性分析cor(dx1[(row.names='4-Pentenoic acid'),],gene1[(row.n原创 2021-03-19 20:07:39 · 9221 阅读 · 21 评论 -
KEGG功能富集气泡图
#点的大小表示基因的数目,颜色表示pvalue的值#> library(ggplot2)> pathway <- read.csv("kegg.csv",header = T)> head(pathway) Pathway AvsB All_Unigene Pvalue Qvalue1 Plant hormone signal transduction 70 254 3.94000e-.原创 2021-02-07 16:40:09 · 10189 阅读 · 3 评论 -
GO功能注释条目图
> go <- read.csv("go.csv",header = T) #Go 条目一般只选择最显著的前10个或20个Term来绘图#> head(go) Ontology1 Biological process2 Biological process3 Biological process4 Biological process5 Biological process6 Biological process .原创 2021-02-04 15:34:45 · 4245 阅读 · 0 评论 -
COG功能注释图
> m <- read.table("cog.class.annot.txt",header = T,sep = "\t")> head(m) Code Functional.Categories Gene.Number1 A RNA processing and modification 902 B .原创 2021-02-02 22:49:44 · 6506 阅读 · 2 评论 -
DC Depth图
#gc%含量为横坐标,depth为纵坐标,从基因组中取一个窗口(如每1000bp,计算gc%和depth的平均值),上侧和右侧的直方图是单独的gc%和depth直方图##有污染序列的GC depth图#> m <- read.table("GC-depth.txt")> head(m) V1 V21 48.0 54.302 39.0 75.903 42.2 83.644 40.8 82.285 50.8 97.736 42.6 84.11> nf &原创 2021-02-02 11:20:15 · 633 阅读 · 0 评论 -
R 火山图
#横轴是log2FoldChange,纵轴是-log10(Qvalue/padjust)##RNA-seq中看表达差异主要看两个方面:1,表达量大于2,即log2FoldChange>1,Qvalue/padjust<0.05或0.01,即-log10(0.01)=2.#> m <- read.csv("Deseq2.csv",header = T,row.names = 1)> head(m) baseMean log2Fold.原创 2021-02-01 16:40:36 · 1436 阅读 · 0 评论 -
R-曼哈顿图
> library(qqman)For example usage please run: vignette('qqman')Citation appreciated but not required:Turner, S.D. qqman: an R package for visualizing GWAS results using Q-Q and manhattan plots. biorXiv DOI: 10.1101/005165 (2014).> gwasResults原创 2021-01-31 21:37:51 · 873 阅读 · 1 评论 -
韦恩图-VennDiagram
library(VennDiagram)载入需要的程辑包:grid载入需要的程辑包:futile.loggerlistA <- read.csv(“genes_list_A.txt”,header = F)listB<- read.csv(“genes_list_B.txt”,header = F)listC<- read.csv(“genes_list_C.txt”,header = F)listD<- read.csv(“genes_list_D.txt”,hea..原创 2021-01-31 18:51:39 · 3002 阅读 · 0 评论 -
热图 heatmap.2 和 pheatmap
```handlebars> getwd()[1] "C:/Users/Administrator/Documents"> setwd("F:/R.work")> getwd()[1] "F:/R.work"> library(gplots)载入程辑包:‘gplots’The following object is masked from ‘package:stats’:lowess> M <- read.csv("heatmap.csv",head.原创 2021-01-31 13:32:26 · 1349 阅读 · 0 评论 -
R Markdown_Rstudio中直接写文档且可导出到word
R Markdown文档导出word设置一新新建R Markdown文档直接写可能刚开始的时候没有在Markdown不显示图片,可以设置一下。我胡乱设置了一下就出来了写完之后导入到word原创 2021-01-30 22:22:57 · 12522 阅读 · 2 评论 -
R-热图(heatmap) 中心化和标准化
原创 2021-01-22 18:13:44 · 4800 阅读 · 0 评论