![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息学
文章平均质量分 72
基因表达矩阵/转录组分析/基因组分析
lazymark2
这个作者很懒,什么都没留下…
展开
-
R语言画基因突变结构图
R语言画基因突变结构图原创 2023-03-13 11:29:17 · 1878 阅读 · 0 评论 -
非模生物STRING结合cytoscape进行PPI画图
软件要求主要使用的软件为cytoscape和stringapp插件。示例具核梭杆菌( Fusobacterium nucleatum , F . nucleatum )假设我们拿到了公司给的差异基因列表,要对这份列表上的基因进行蛋白互作分析。> head(gene_FN)# A tibble: 6 × 5 ID logFC pvalue Description Status <chr> <dbl>原创 2021-10-12 11:27:15 · 3819 阅读 · 0 评论 -
bam格式转换为Fastq/Fasta格式
bam格式转换为Fastq/Fasta格式Samtools FastqGATK SamToFastqBedtools bamtofastq举例说明,比如说我们现在有一个转录组比对文件D1_D1.sort.bam:samtools view -H D1_D1.sort.bam | tail@SQ SN:19 LN:58617616@SQ SN:20 LN:64444167@SQ SN:21 LN:46709983@SQ SN:22 LN:50818468@SQ SN:X LN:1560原创 2021-09-18 18:13:04 · 13269 阅读 · 2 评论 -
简单脚本自动查询Phred质量分数编码系统
简单脚本自动查询Phred质量分数编码系统1)`less $1`2)`head -n 1000`3)`awk '{if(NR%4==0) printf("%s",$0);}'`4)`od -A n -t u1 -v`修改自:从零开始完整学习全基因组测序数据分析:第2节 FASTA和FASTQless $1 | head -n 1000 | awk '{if(NR%4==0) printf("%s",$0);}' | od -A n -t u1 -v \| awk 'BEGIN{min=100;max原创 2021-09-03 00:00:01 · 368 阅读 · 0 评论 -
转录组分析中Trimmomatic和Trim_galore详细使用说明(2) Trim_galore
Trim_galore 实际上是个套皮的Cutadapt和Fastqc,主要都是用Perl写的。优劣势分析优势:1、安装和使用都非常简单;2、代码较短3、参数更直观,不用去死记硬背4、默认下paired和unpaired,运行速度较快劣势:1、可调参数较少除此之外,trim_galore还有一个特色就是可以对RRBS(Reduced Representation Bisulfite Sequencing, DNA甲基化测序)构建的文本库进行相应的质控,比如“–rrbs” 参数对于 RRBS原创 2021-08-05 00:41:18 · 5670 阅读 · 0 评论 -
Aspera/FTP下载SRA/fastq文件后根据样本信息进行批量重命名
从NCBI下载:sra的数据库格式为/sra/sra-instant/reads/ByRun/sra/{SRR|ERR|DRR}/<first 6 characters of accession>/<accession>/<accession>.srafor i in `cat accession.txt`;dox=$(echo $i | cut -b 1-6)y=$(echo $i | cut -b 1-3)ascp -T -i ~/.aspera/co原创 2021-07-28 13:50:17 · 882 阅读 · 0 评论 -
基因表达矩阵中排除表达量低的样本和基因
构建基因表达矩阵的时候,其基因个数和样本个数都会达到成千上万个,这时在做PCA分析或者差异基因分析前最好排除表达量低的样本和基因#加载相应的安装包library(tidyverse)#例子如下gdf <- tibble(g = rnorm(4, 0.5, 0.5), v1 = rnorm(4,1,0.5), v2 = rnorm(4, 1.5, 0.5) gdf <- gdf%>% mutate(v3 = rep(0,4)) gdfOutput:# A tibble: 4原创 2021-06-23 00:53:19 · 14307 阅读 · 0 评论 -
转录组分析中Trimmomatic和Trim_galore详细使用说明(1) Trimmomatic
优劣势分析Trimmomatic优势:1、可使用参数更多,如滑窗剪切,可以直接选择使用内置的接头序列等等2、可生成paired和unpaired两种文件,更利于下游分析劣势:1、代码非常长,而且容易写错,最好写在一个脚本里;2、参数比较难记,像ILLUMINACLIP中的几个数字分别代表什么必须要对照说明书才能看懂3、运行时间较长,建议在测序质量较好并且接头残余少的时候使用trim_galoreTrim_galore优势:1、安装和使用都非常简单;2、代码较短3、参数更直观,不用去原创 2021-07-30 02:54:02 · 8267 阅读 · 1 评论