自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 收藏
  • 关注

转载 R语言ggplot中的颜色

ggplot2分组时默认使用的颜色,可以从另一个hadley写的包,scales包中调用。这个包算是一个工具包,用于和hadley写的其他包配合使用,颜色是其中一部分。library(scales)show_col(hue_pal()(3))# show_col(hue_pal(h = c(0, 360) + 15, c = 100, l = 65)(3)) # 和上面一...

2019-08-21 09:59:00 5754

转载 Converting mouse to human gene names with biomaRt package

musGenes <- c("Hmmr", "Tlx3", "Cpeb4") # Basic function to convert mouse to human gene namesconvertMouseGeneList <- function(x){ require("biomaRt")human = useMart("ensembl", d...

2019-07-04 17:48:00 380

转载 利用conda创建工作环境

unset PYTHONPATHecho $PYTHONPATH# https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/# https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/ wget https://mirrors.tuna.tsinghua.edu.cn...

2018-12-12 10:34:00 362

转载 R语言分组计数

输入数据如下:分组计数tapply(cancer.type.gender$Count,list(cancer.type.gender$Gender,cancer.type.gender$Project),sum)aggregate(x=cancer.type.gender[c('Count')], by = list(cancer.type.gender$Gend...

2018-11-07 14:11:00 3646

转载 MAC电脑R语言路径不显示中文

MAC电脑R语言路径不显示中文,可以设置显示为UTF-8Sys.setlocale("LC_CTYPE", "UTF-8")  转载于:https://www.cnblogs.com/qiniqnyang/p/9896062.html

2018-11-02 14:26:00 1196

转载 将一行分成多行.R

Roptions(stringsAsFactors=FALSE)df <- data.frame(x1=c("A","B","D","E"), x2=c("中国、美国","德国、日本","意大利",NA) )country_list <- strsplit(with(df,x2),"、")count_n <- sa...

2018-08-14 17:39:00 1026

转载 temp1

1.从bam文件中提取位点的测序深度samtools depth -b intervals.bed 1.bamintervals.bed文件包括需要提取的位点chr1 39717581chr1 39898741chr1 40928207chr1 91405097chr1 99225626chr1 150812033chr1 155448...

2018-07-18 17:44:00 209

转载 MAC电脑修改ssh端口

简单的把过程写一下:1.备份ssh.plist:cp /System/Library/LaunchDaemons/ssh.plist /Library/LaunchDaemons/ssh2.plistchmod o+w /Library/LaunchDaemons/ssh2.plistvim /Library/LaunchDaemons/ssh2.plistsudo ...

2018-05-08 17:34:00 1271

转载 根据list调取特定基因的fasta序列

fasta序列:>ORF type:5prime_partial len:117 (+) 2T_between1k2k_c100001_f2p26_1105:1-351(+)CCCCAGGACATGAAGGGTGCCTCTCGAAGCCCCGAAGACAGCAGTCCGGATGCCGCCCGCATCCGAGTCAAGCGCTACCGCCAGAGCATGAACAACTTCCAGG...

2017-11-27 14:47:00 318

转载 Ubuntu apt-get不到最新版软件包解决方案

1.可能是系统版本太老的问题解决办法换新系统2.可能是apt源的问题在/etc/apt目录下面有一个source.list文件,修改它,在后面加上下面几个源或者选择性加入#官方源:deb http://archive.ubuntu.com/ubuntu/ vivid main restricted universe multiversedeb http://arc...

2017-10-13 09:45:00 584

转载 getGeneLengthFromGTF.R

## Please see https://www.biostars.org/p/196548/#196757## Transcript Lengthlibrary(GenomicRanges)library(rtracklayer)## reading your mm10 gtf file and read only exonsGTFfile <- g...

2017-09-14 09:26:00 270

转载 TCGA_DNA_seq Analysis

DNA-Seq Alignment Command Line ParametersSTEP 1: CONVERTING BAMS TO FASTQS WITH BIOBAMBAM - BIOBAMBAM2 2.0.54bamtofastq \collate=1 \exclude=QCFAIL,SECONDARY,SUPPLEMENTARY \filename...

2017-09-06 13:57:00 251

转载 DecisionCurve决策曲线分析法

这里有一份示例数据,是NHLBI(美国国家心肺血液研究所)的Framingham心脏研究专项数据集的一个子集,4000多个样本。自变量分别为性别(sex)、收缩压(sbp)、舒张压(dbp)、血清胆固醇(scl)、年龄(age)、身体质量指数(bmi)等,因变量为冠心病相关死亡事件(chdfate)。因变量必须是二元变量,随访时间内死亡为1,未死亡为0。一个是简单模型,以血清胆固...

2017-06-13 15:24:00 3313

转载 limma package计算差异表达

test.txt:文件格式: geneTCGA-3M-AB46-01A-11R-A414-31TCGA-3M-AB47-01A-22R-A414-31TCGA-B7-A5TK-01A-12R-A36D-31TCGA-B7-A5TN-01A-21R-A31P-31A2LD14316062731194A2M358...

2017-03-17 09:35:00 536

转载 绘制热图

首先准备数据: gene_ididTCGA-2J-AAB101A-11R-A41B-07TCGA-2J-AAB4-01A-12R-A41B-07TCGA-2J-AAB6-01A-11R-A41B-07TCGA-2J-AAB8-01A-12R-A41B-07TCGA-2J-AAB9-01A-11R-A41B-07TCGA-2J...

2017-01-25 13:43:00 599

转载 查找fasta文件中每条染色体的gc含量

test.fa>chr_1ATCGTCGaaAATGAANccNNttGTAAGGTCTNAAccAAttGggG>chr_2ATCGAATGATCGANNNGccTAAGGTCTNAAAAGG>chr_3ATCGTCGANNNGTAATggGAAGGTCTNAAAAGG>chr_4ATCGTCaaaGANNAATG...

2017-01-12 21:25:00 778

转载 利用tcga数据做生存分析

####teach code####library(survival)#read expression data and modify its class and colnames/rownames#PAAD_gene_expression.csv数据已经经过Z_转换的数据。z_rna <- read.csv(file="PAAD_gene_expression.csv",...

2017-01-12 10:30:00 2122

转载 计算基因组外显子长度

下载基因组外显子信心网站ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/wgetftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/CCDS.current.txt运行下列代码 得到外显子大约36Mimport reimport osfrom collec...

2017-01-09 23:51:00 1924

转载 quantile normalization原理

对于芯片或者其它表达数据来说,最常见的莫过于quantile normalization啦。那么它到底对我们的表达数据做了什么呢?首先要么要清楚一个概念,表达矩阵的每一列都是一个样本,每一行都是一个基因或者探针,值就是表达量咯。quantile normalization 就是对每列单独进行排序,排好序的矩阵求平均值,得到平均值向量,然后根据原矩阵的排序情况替换对应的平均值,所以no...

2016-12-29 11:00:00 1777

转载 做矩阵的相关性

A.txtA1 10.5318295 10.99222177 11.03562467 10.96557789 10.83035429A2 6.739434821 7.116196513 6.580855876 6.373403461 6.171394699A3 8.211470461 7.408179667 8.609446009 7.703020111 8.136612015A4 ...

2016-12-29 10:20:00 221

转载 R中数据拆分和整合

library(data.table)ID <- c(NA,1,2,2)IDTime <- c(1,2,NA,1)TimeX1 <- c(5,3,NA,2)X1X2 <- c(NA,5,1,4)X2mydata <- data.table(ID,Time,X1,X2) mydata`````````````````````````` ID Time ...

2016-12-19 13:57:00 371

转载 三列数据转换为矩阵

1.首先转被数据A1:C62.公式G1:L7SUMPRODUCT(($G2&H$1=$A$1:$A$6&$B$1:$B$6)*($C$1:$C$6))转载于:https://www.cnblogs.com/qiniqnyang/p/6186207.html

2016-12-16 11:33:00 2404

转载 利用cytoscape做网络图

首先做出下面的基因间相互关系图1.准备sif文件data.sif 网络数据文件gene1 pp gene2 gene3 gene4 gene5 gene6 gene7 gene8 gene9node.txt 网络属性文件gene expgene1 0.2gene2 0.3gene3 0.7gene4 0.3gene5 0.9gene6 0.7gene7 0....

2016-12-08 20:40:00 2534

转载 exel按行查找或按列查找

表1:sheet11). 在表1中找出ID号位0928的基因相对应的数值在相对应的单元格输入:B2=VLOOKUP(A:A,Sheet1!A:D,3,0)既可以得到:····························································································...

2016-10-17 18:37:00 210

转载 exel中合并一列相同的数据到一行

Sub 按钮1_Click() Application.ScreenUpdating = Falsearr = Range("a1:c" &[a65536].End(xlUp).Row)[g1].CurrentRegion.ClearContentsCells(1, "g") = arr(1, 1)Cells(1, "h") = arr(1, 2)Ce...

2016-10-14 18:21:00 101

转载 awk中分隔符转换

awk中分隔符转换的问题(转)在awk中明明用OFS重新设置了分隔符,为什么在输出的时候还是原样输出呢! 他是这么写的: echo 1,2,3,4 | awk 'BEGIN{FS=",";OFS="|"}{print}'”。 其实在awk中,只设置分隔符而不改变文件的内容,重新设置的分隔符是不会生效的,所以必须让awk认为你改变分隔符的同时也改变了文件的...

2016-10-12 17:04:00 478

转载 合并excel中多个sheet

Sub 合并当前工作簿下的所有工作表()Application.ScreenUpdating = FalseFor j = 1 To Sheets.Count If Sheets(j).Name <> ActiveSheet.Name Then X = Range("A65536").End(xlUp).Row + 1 Shee...

2016-10-12 16:40:00 82

转载 合并文件夹里多个excel

Sub 合并当前目录下所有工作簿的全部工作表()Dim MyPath, MyName, AWbNameDim Wb As workbook, WbN As StringDim G As LongDim Num As LongDim BOX As StringApplication.ScreenUpdating = FalseMyPath = ActiveWor...

2016-10-12 16:30:00 150

转载 利用excel拆分数据

要求:将sheet1中的数据按照公司名称拆分到不同的工作表使用VBA:1:打开sheet1的查看代码2:运行······························································································Sub cfs()Dim GSArr() As String '公...

2016-09-25 19:23:00 111

转载 利用RNAseq数据做聚类分析

library(ConsensusClusterPlus)library(factoextra)library(cluster)library(NbClust)# 读入数据data = read.table("T_405_ex.txt",header = T, row.names = 1)b = matrix(data, nrow = 1, ncol = 1)new<-as.mat...

2016-09-19 09:57:00 2070

转载 根据癌变细胞的外显子数据获取肿瘤的“进化树”史

##################################################################################################################### ############## CNA and SNA input ############## #############################...

2016-09-15 17:09:00 275

转载 ConsensusClusterPlus根据基因表达量对样品进行分类

#http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2881355/一致聚类方法,采用重抽样方法来验证聚类合理性。library(ALL)data(ALL)d=exprs(ALL)d[1:5,1:5]#对上面这个芯片表达数据我们一般会简单的进行normalization (本次采用中位数中心化),然后取在各个样品差异很大的那些gene...

2016-09-12 15:14:00 4236

转载 用excel绘制基因芯片热力图

1. 首先我们通过一些方法得到了如下的数据,基于篇幅以及为了教学隐去了其他一些信息。2.选中表达数据,执行 开始—条件格式—色阶 选择一个合适的色阶:3.选择好颜色之后得到了如下结果:4.怎么样,已经有热力图的基本样式了吧,我们需要把文字隐藏掉。首先选择数据区域,然后执行 开始—格式—设置单元格格式:5.在弹出的对话框内,选择数字——自定义,在类...

2016-09-01 16:02:00 540

转载 使用clusterprofile做聚类分析

library(clusterProfiler )#cat test.txtgene_symbolEXOSC10ARHGEF10LVWA5B1SRRM1PTAFRCSMD2SH3GLB1GBP6ZNF326AKNAD1STRIP1GOLPH3L...............a <- read.table("test.txt",colClasses = "charac...

2016-08-31 17:39:00 1674

转载 用excel做差异表达

首先准备数据:表达矩阵ACC.uncv2.mRNAseq_RSEM_normalized_log2.txt(以下载的TCGA的数据,log之后的)上面数据中01为tumor,11为normal我们进行差异分析,就是看两组的表达值,是否差异,而检验的方法就是T检验a=AVERAGE(B2:G2) ##求tumor组的平均表达量b=AVERAGE(H2:O2) ...

2016-08-30 14:03:00 1025

转载 使用R进行倾向得分匹配

pacman::p_load(knitr, wakefield, MatchIt, tableone, captioner)set.seed(1234)library(wakefield)df.patients <- r_data_frame(n = 250, age(x = 30:78, ...

2016-08-26 16:02:00 3208

转载 GSEA的使用

下载GSEA网址:http://software.broadinstitute.org/gsea/downloads.jspgsea2-2.2.2.jarc2.cp.kegg.v5.1.symbols.gmtP53.clsP53_hgu95av2.gctHG_U95Av2.chip运行示例:java -cp gsea2-2.2.2.jar -Xmx1024...

2016-08-17 16:19:00 334

转载 用TCGA收集的mRNA表达数据作差异表达

做差异表达的软件DEseq和edgeR所需要的数据格式必须是原始counts,经过normalization和log2后的数据都不适合,所以对于做差异表达计算的童鞋可以使用ExperimentHub下载TCGA的原始数据。GEO地址:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE62944安装:首先安装环境要求BioC 3....

2016-08-11 11:26:00 1502

转载 外显子测序数据拷贝数变异分析(带更正)

Step-1: Run varscan2 on normal-tumor-mpileup and make copy-number call.java -jar $varscan copynumber normal-tumor-mpileup $outputFile --mpileup 1 --p-value 0.005 --min-coverage 30 --min-map-qual ...

2016-07-28 11:44:00 1787

转载 gastic 安装

所有文件下载地址:ftp://ftp.broadinstitute.org/pub/GISTIC2.0/cd /home/software/tar zxf GISTIC_2_0_22.tar.gzcdGISTIC_2_0_22#安装MCR环境./MCRInstaller.bin(安装到当前文件夹中的MATLAB Component Runtime文件夹中)然...

2016-07-22 12:17:00 357

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除