如何利用linux分析转录组数据库,对转录组测序数据进行分析以及注释

随着二代测序技术的高速发展,人们获得了大量的转录组数据序列如何从数据中挖掘具有生物意义的信息已经成为很多研究的关键,对未知基因的功能进行预测和注释就是一个重要问题

这篇文章主要是跟着 刘粉香,杨文国,孙勤红,三位老师的文献对测序数据进行分析以及GO注释,旨在学习测序数据分析的方法以及GO注释的方法

数据来源于NCBI上的SRA数据库 SRR063784

1.原始测序数据下载与质控

#下载数据

~/.aspera/connect/bin/ascp -T -i /home/qiujunhui/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR063/SRR063784/SRR063784.sra ./

#解压

fastq-dump SRR063784.sra

#质控

mkdir fastqc_out

fastqc -o fastqc_out/ --noextract SRR063784.fastq

#用Trimmomatic切除reads的phred值小于20的

java -jar ~/Biosofts/Trimmomatic-0.38/trimmomatic-0.38.jar SE -phred33 SRR063784.fastq SRR063784_clean.fastq LEADING:20 TRAILING:20

TrimmomaticSE: Started with arguments:

-phred33 SRR063784.fastq SRR063784_clean.fastq LEADING:20 TRAILING:20

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值