转录组:STAR-Fusion融合基因

融合基因介绍

概念
在RNA水平上,由多个转录本构成的转录本。
在DNA水平上,由两个或多个基因共同组成的新基因。
在这里插入图片描述
NGS如何鉴定融合基因

  1. spanning reads
    R1和R2没有覆盖到连接点,只是比对的位置位于两个不同的基因上。潜在的融合基因,解释性较弱。
    在这里插入图片描述
  2. split reads
    R1或R2的一条read位于连接点的两侧,有一条read直接覆盖到连接点上。解释性较强。
    在这里插入图片描述
    本质
    染色体重排。
    研究意义
    异常基因融合可能引用恶性血液疾病以及肿瘤。探讨发病机制、biomaker的筛选。
STAR-Fusion

原理

  1. 将reads通过STAR比对reference genome,筛选出split和dicordant reads作为候选融合基因。
  2. 候选融合基因与reference genome比对,根据overlap预测出融合基因。
  3. 过滤预测结果,去除假阳性结果。

运行步骤
STAR-Fusion可以这件用原始Fastq数据分析。
4. 下载genome resouce lib:https://data.broadinstitute.org/Trinity/CTATRESOURCELIB/ 在这里插入图片描述
5. 预处理genome resource lib:

FusionFilter/prep_genome_lib.pl
	--genome_fa ref_genome.fa
	--gtf ref_annot.gtf
	--fusion_annot_lib fusion_lib.dat.gz 融合基因注释信息
	--blast_pairs blast_pairs.outfmt6.gz
	--pfam_db PFAM.domtblout.dat.gz
  1. 运行
STAR-Fusion
	--genome_lib_dir CTAT_resource_lib(建立的reference lib所在的目录)
	--left_fq read-1.fq
	--right_fq(单端时省略该参数) read_2.fq
	--output_dir star_fusion_outdir

输出结果
star-fusion.fusion_predictions.abridged.tsv,比较关心的是转录本融合的左右两个转录本的ID和融合为电动的坐标。JunctionReadSpanningFrag个数越多,为一个真实的融合基因的可能性越大。spliceType表示断裂点breakpoint是否位于exon边界。

#FusionName           JunctionReadCount  SpanningFragCount  SpliceType           LeftGene                        LeftBreakpoint    RightGene                        RightBreakpoint   LargeAnchorSupport  FFPM        LeftBreakDinuc  LeftBreakEntropy  RightBreakDinuc  RightBreakEntropy  annots
THRA--AC090627.1      27                 93                 ONLY_REF_SPLICE      THRA^ENSG00000126351.8          chr17:38243106:+  AC090627.1^ENSG00000235300.3     chr17:46371709:+  YES_LDAS            23875.8456  GT              1.8892            AG               1.9656             ["CCLE","FA_CancerSupp","INTRACHROMOSOMAL[chr17:8.12Mb]"]
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要分析转录差异基因,可以使用R语言中的DESeq2包。首先,需要导入DESeq2包并安装所需的依赖项。可以使用以下命令来完成这一步骤: ``` #source("https://bioconductor.org/biocLite.R") #载入安装工具 #BiocManager::install("DESeq2")#安装包 library(DESeq2) ``` 接下来,将基因表达量数据和分信息导入R环境中,并创建一个DESeqDataSet对象。可以使用以下命令来实现: ``` mycounts_1 <- round(mycounts_1, digits=0) #将输入数据取整,若为count数据不需要这一步 dds <- DESeqDataSetFromMatrix(countData = mycounts_1, #基因表达量表 colData = mymeta, #分信息表 design = ~dex) #分信息里的列名 ``` 然后,可以使用DESeq函数来进行差异表达分析,并将结果保存在一个DESeqResults对象中。可以使用以下命令来完成这一步骤: ``` dds <- DESeq(dds) res <- results(dds) ``` 接下来,可以查看差异表达基因的前几行,以及结果对象的类别。可以使用以下命令来实现: ``` head(res) class(res) ``` 如果需要将结果保存为一个数据框,可以使用以下命令: ``` res_1 <- data.frame(res) class(res_1) head(res_1) ``` 为了进一步分析差异基因的上下调情况,可以使用dplyr包中的mutate函数将基因分为上调、下调和不显著差异的三个,并统计每个基因的数量。可以使用以下命令来实现: ``` library(dplyr) res_1 %>% mutate(group = case_when( log2FoldChange >= 1 & pvalue <= 0.05 ~ "UP", log2FoldChange <= -1 & pvalue <= 0.05 ~ "DOWN", TRUE ~ "NS" )) -> res_2 table(res_2$group) ``` 最后,如果需要将上述结果保存为CSV文件,可以使用以下命令: ``` write.csv(res_2, file = "res_2.csv") ``` 这样,就可以完成R语言中转录差异基因的分析。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [转录-DESeq2筛选差异基因](https://blog.csdn.net/weixin_59909329/article/details/124035131)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [转录-差异基因热图](https://blog.csdn.net/weixin_59909329/article/details/124774333)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值