生信技能
Shannon.Y
生物信息工程师
展开
-
Rtoos与R
Rtools工具对于某些包的安装来说是必须的,如果安装R包时出现“没有make”这样的报错,可能就是没有Rtools导致。例如安装devtools包就必须需要Rtools。Rtools的安装方法有很多,包括exe+环境变量、installr包安装等。原创 2022-10-10 14:14:57 · 264 阅读 · 1 评论 -
使用Rcircos绘制基因组坐标图出现基因坐标溢出的解决方法
使用Rcircos绘制基因组坐标时出现基因组坐标溢出的解决方法原创 2022-10-07 21:49:45 · 425 阅读 · 1 评论 -
关于color space测序的样本处理+代码
虽然SOLID测序数据已经非常少见了,但偶尔研究人员会有分析的需要,现有的许多方法和工具都是基于basespace的,在这里想记录一下对于colorspace的处理方法及注意事项。一般来讲,有两种处理colorspace文件的方式。一是转成BS的fastq格式,这样一来就可以使用我们熟悉的分析工具进行分析,二是使用专门处理CS的软件进行align,比较常见的是fastqc,cutadap,SHRiMP,sequel和BFAST ,bowtie等等。虽然第一种方法存在,但由于CS数据本身的缺陷,即它表示的意原创 2021-10-11 10:59:15 · 474 阅读 · 0 评论 -
关于prefetch下载Sra数据报错
其实我自己使用prefetch工具以来,遇到的错误并不多,大多是由于网络环境导致的,在网络上查询也可以看出,大多数情况下prefetch的问题还是出在网络环境上。但有些问题并非由于网络引起,而是自己数据的问题。我在批量下载约100个数据时,遇到的报错信息如下:报错提供了3个信息点:无法获取到SRRid,即prefetch无法识别txt文件中给出的id信息。虽然大多数样本无法下载,但仍有几个可以正常下载。虽然在脚本中不可下载,但手动输入prefetch SRR123456没有问题。这个问题着原创 2021-10-11 10:28:06 · 10992 阅读 · 0 评论 -
差异表达基因提取limma+WGCNA分析全代码
#数据提取#GE<-read.table('TCGA-COAD.htseq_counts.tsv',header=T,sep='\t',stringsAsFactors = F)#60488*513 512个样本,其中对照组41个# group_data<-data.frame(colnames(GE)[-1])group<-rep('tumor',512)group[grep("11A", colnames(GE)[-1], ignore.case = FALSE, perl原创 2021-03-11 10:27:17 · 4999 阅读 · 2 评论 -
GEO数据库数据下载方法总结
#GEO数据下载GEO是生信分析经常用到的数据库。经常需要从中获取表达矩阵,平台信息,meta信息等,本博文总结了几种下载GEO数据的方法,各有优劣,实际应用过程中自行选择适合自己的。##方法一:直接从浏览器中下载以数据集GSE1001为例,可以直接点击“Series Matrix Files”获取该样本txt格式的表达谱数据,一般我们认为这种处理过的表达谱数据是没有问题的,当然,具体情况具体分析。打开下载的文件可以看到许多“#”开头的行,这些是注释信息,一般关注这些注释信息中的“data pr原创 2021-03-11 10:23:52 · 35138 阅读 · 0 评论