2020.12.03丨全长转录组之基因和转录本鉴定

  • 折叠转录本
    • 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余)
    • PacBio分析软件:
      • TAMA:https://github.com/GenomeRIK/tama
        • TAMA简介
          • TAMA(T ranscriptome A nnotation by M odular A lgorithms 是一款设计用于处理 Iso Seq 数据和其他长 reads 转录本数据,该软件 2019 年 在预印本在线期刊( bioRxiv )发表 。
            Illuminating the dark side of the human transcriptome with TAMA Iso Seq analysis:https://www.biorxiv.org/content/10.1101/780015v1
             
          • 三个主要应用:
            • 1 TAMA Collapse (折叠冗余转录本
            • 2 TAMA Merge
            • 3 TAMA GO
        • 安装:直接使用,无需编译
        • 依赖环境:Python2、Biopython
        • 使用命令:
          • python /path-to-tama/tama_collapse.py -b BAM -s flnc.fasta.sorted.bam -f hg38.fa -x no_cap -e longest_ends -p isoform > tama.collapse.log
          • 参数说明
        • 结果展示
          • 文件
          • 正链基因,右边相同,左边折叠;负链基因,左边相同,右边折叠
      • cDNA_Cupcake:https://github.com/Magdoll/cDNA_Cupcake
        • 简介:
          • cDNA_Cupcake是用于分析测序数据的 Python 和 R 脚本的集合,主要用于 cDNA
          • 典型应用:
            • 1 折叠转录本;
            • 2 合并多样本结果
            • 3 饱和度曲线
            • 4 鉴定融合基因
        • 下载:
          • git clone https://github.com/Magdoll/cDNA_Cupcake.git
        • 安装:
          • cd cDNA_Cupcake
          • git checkout origin/Py2_v8.7.x
          • python setup.py build
          • python setup.py install
        • 使用命令:
          • python /path to cDNA_Cupcake/cupcake/tofu/collapse_isoforms_by_sam.py
          • --input flnc.fasta s flnc.fasta.sorted.sam
          • --min coverage 0.99 min identity 0.95
          • --max_5_diff 1000 max_3_diff 100
          • -o prefix
          • 参数说明:
        • 结果展示:
          • 结果文件
  • 基因/转录本鉴定
    • SQANTI3:https://github.com/ConesaLab/SQANTI3
      Corrigendum: SQANTI: extensive characterization of long read transcript sequences for quality control in full length transcriptome identification and quantification:https://genome.cshlp.org/content/28/7/1096
       
      • 简介:
        • SQANTI3是SQANTI 工具(发布)的最新版本,该工具合并 SQANT 1 和 SQANTI2 中的功能并添加新的功能 ,用于全长转录本的深度表征 。
        • 主要应用:
          • 1 sqanti3_qc.py (执行转录本的深度表征
          • 2 sqanti3_RulesFilter.py (基于机器学习算法过滤假阳性转录本
      • 下载:
        • git clone https://github.com/ConesaLab/SQANTI3.git
      • 使用命令:
        • ## step1: qc
          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_qc.py
          • test_chr13_seqs.fasta Homo_sapiens.GRCh38.86.chr13.gtf Homo_sapiens.GRCh38.dna.chromosome.13.fa
          • --fl_count chr13_FL.abundances.txt -o Sample
          • 参数说明
        • ## step2: filter
          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_RulesFilter.py
          • Sample_classification.txt Sample_corrected.faa Sample_corrected.gtf
          • 参数说明
  • 实操分析
    • SQANTI3测试数据(example文件夹)
      • 文件
    • 补充:SQANTI3 sqanti3_qc.py )分析的第一个输入文件来源于 collapse 之后的结果( gmap.collapsed.rep.fa
  •  
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

穆易青

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值