RNA 31. SCI文章临床蛋白质组肿瘤在线数据挖掘神器(CPTAC)

d37f7112d65a178589d234656de2dcdf.gif    

桓峰基因公众号推出转录组分析教程,有需要生信的老师可以联系我们!转录分析教程整理如下:

RNA 1. 基因表达那些事--基于 GEO

RNA 2. SCI文章中基于GEO的差异表达基因之 limma

RNA 3. SCI 文章中基于T CGA 差异表达基因之 DESeq2

RNA 4. SCI 文章中基于TCGA 差异表达之 edgeR

RNA 5. SCI 文章中差异基因表达之 MA 图

RNA 6. 差异基因表达之-- 火山图 (volcano)

RNA 7. SCI 文章中的基因表达——主成分分析 (PCA)

RNA 8. SCI文章中差异基因表达--热图 (heatmap)

RNA 9. SCI 文章中基因表达之 GO 注释

RNA 10. SCI 文章中基因表达富集之--KEGG

RNA 11. SCI 文章中基因表达富集之 GSEA

RNA 12. SCI 文章中肿瘤免疫浸润计算方法之 CIBERSORT

RNA 13. SCI 文章中差异表达基因之 WGCNA

RNA 14. SCI 文章中差异表达基因之 蛋白互作网络 (PPI)

RNA 15. SCI 文章中的融合基因之 FusionGDB2

RNA 16. SCI 文章中的融合基因之可视化

RNA 17. SCI 文章中的筛选 Hub 基因 (Hub genes)

RNA 18. SCI 文章中基因集变异分析 GSVA

RNA 19. SCI 文章中无监督聚类法 (ConsensusClusterPlus)

RNA 20. SCI 文章中单样本免疫浸润分析 (ssGSEA)

RNA 21. SCI 文章中单基因富集分析

RNA 22. SCI 文章中基于表达估计恶性肿瘤组织的基质细胞和免疫细胞(ESTIMATE)

RNA 23. SCI文章中表达基因模型的风险因子关联图(ggrisk)

RNA 24. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER)

RNA 25. SCI文章中估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter)

RNA 26. SCI文章中基于转录组数据的基因调控网络推断 (GENIE3)

RNA 27 SCI文章中转录因子结合motif富集到调控网络 (RcisTarget)

FigDraw 28. SCI文章中绘制雷达图/蛛网图 (RadarChart)

RNA 29. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER2.0)

国家癌症研究所的临床蛋白质组肿瘤分析联盟(CPTAC)是一项全国性的努力,旨在通过大规模蛋白质组学和基因组分析或蛋白质基因组学的应用来加速对癌症分子基础的理解。

3518938adccb0147518115ab77f122b7.png

CPTAC于2011年启动,开创了结直肠癌、乳腺癌和卵巢癌的综合蛋白质基因组分析,揭示了对这些癌症类型的新见解,如蛋白质组学中心亚型的鉴定,通过拷贝数改变和蛋白质丰度的相关分析确定驱动突变的优先级,以及通过翻译后修饰了解癌症相关通路。

CPTAC目前正在利用其在癌症蛋白质基因组学方面的投资,通过描述其他癌症类型,通过开源社区资源扩大其应用,并通过将蛋白质基因组学应用于临床试验中的毒性和耐药性问题来加速精准肿瘤学。这是通过CPTAC下属的蛋白质组表征中心、蛋白质基因组转化研究中心和蛋白质基因组数据分析中心在全国各地的协调努力实现的。CPTAC在蛋白质基因组学方面的进展使2016年的两个项目得以创建,旨在加深我们对这一新兴领域的理解。应用蛋白质基因组学组织学习与结果(APOLLO)网络旨在通过与国防部和退伍军人管理局的医疗保健系统合作,研究如何使患者肿瘤的蛋白质基因组分析成为常规癌症护理的一部分,从而有效地连接肿瘤研究和护理。同样,国际癌症蛋白质基因组联盟(ICPC)促进了10多个国家的合作,以研究其独特人群中常见诊断的癌症,目标是提高精准肿瘤学,并与世界各地的科学家和医生共享收集的数据。

数据(基因组学、蛋白质组学、成像)、分析和试剂作为社区资源提供给公众,以加速癌症研究和推进患者护理。

https://proteomics.cancer.gov/programs/cptac

进入主页之后,我们可以看到右侧又三个入口:

35c95ac81acfe3129f14ee9f5edb05c7.png

进入 Data portal:

a909c4eec5685c20ef2685afbab39632.jpeg

OCCPR的核心任务之一是与生物医学研究界共享和重用蛋白质基因组数据和图像数据,因为这对于加速科学发现及其临床转化为患者护理至关重要。

蛋白质组学数据共享(PDC)是NCI最大的蛋白质基因组综合肿瘤数据集公共存储库,本质上是一个蛋白质基因组癌症图谱。蛋白质组数据和相关数据文件按肿瘤类型、研究和亚蛋白质组组织成数据集。除了基于原始质谱的数据文件外,还进行了计算处理,以将光谱映射到肽序列并识别蛋白质。CPTAC研究中收集的所有光谱都作为CPTAC公共数据分析管道的一部分进行了一致性和可重复性分析,并为每个研究生成了交互式QC报告。所有数据都免费向公众开放。CPTAC和ICPC蛋白质组学数据可以在PDC上找到。

基因组数据共享(GDC)为癌症研究社区提供了统一的存储库和癌症知识库,支持在癌症基因组研究中共享数据,以支持精准医疗。CPTAC的基因组数据可以在GDC上找到。请向dbGaP申请访问受保护的CPTAC基因组数据。

癌症影像档案(链接为外部)(TCIA)是一项识别和托管大型癌症医学影像档案的服务,供公众下载。TCIA数据被组织为“集合”。尝试使用表上方的过滤框,使用关键字“CPTAC”快速查找CPTAC集合。当在出版物中使用CPTAC生成的蛋白质组学、基因组学或成像数据时,请使用以下确认。“本出版物中使用的数据由临床蛋白质组学肿瘤分析联盟(CPTAC)生成。”当使用由ICPC所属机构生成的数据时,请确认相应的机构。

进入 PDC:

d0a4efcfb2e308f79fc25a2b72242a59.png

提到TCGA,我们都知道对应的基因组数据访问入口是GDC Data Portal。而Proteomic Data Commons (PDC)则是NCI最大的基于质谱的肿瘤蛋白质组学数据库。除了原始的质谱基础数据,数据库也通过计算分析,将质谱映射到多肽序列并鉴定蛋白。CPTAC 原本的数据访问入口在2022年2月已关停,目前已转移到PDC。PDC是一个对蛋白质组学数据进行高质量质控,整合并统一标准,提供高效查询,可视化,分析和下载的平台,有效提升了多组学分析的便利性。CPTAC和ICP,以及其他项目的蛋白组学数据都可以在PDC上查看,分析和下载。

PDC可供下载的文件类型如下,其中大部分是原始文件,主要的结果文件是 summary.tsv,包含了蛋白的定量结果。

以结直肠癌为例介绍数据详情。点击进入后,类似TCGA GDC页面,左侧是多种筛选类型。右侧分别是样本介绍和数据文件描述。数据文件包括Studies,Biospecimens,Clinical,Files,Genes五个部分组织。或直接通过主菜单EXPLORE进入,页面内容相同,可查看全部样本或通过左侧筛选。

  • Studies是对研究项目的介绍,包括疾病类型,样本数目,分析内容等。

  • Biospecimens主要是样本详情,比如说明是肿瘤样本还是邻近正常组织。

  • Clinical主要包含临床相关信息,比如诊断结果,形态特征,肿瘤分期,复发时间等。如果PDC中的study有对应的基因组或图像诊断数据,在Clinical页面的 Genomic and Imaging Data Resource列会有相应链接,可直接点击下载或先下载Clinical文件,其中会包含外部链接的id和url。

  • Files主要包括研究对应的可供下载的文件。

  • Genes主要包括研究中鉴定到的蛋白,翻译后修饰位点,及其肽段序列详情。

数据页面除Genes页面查看对应丰度信息,其他数据多需要下载进行下游分析。

数据分析PDC分析工具ANALYSIS

b2c8338e41eff8ab4c1cac7692781357.png

(1)Explore Quantitation Data

PDC通过标准分析流程产生结果后可用于鉴别蛋白质和翻译后修饰(PTMs)丰度的pattern,并通过热图展示。Explore Quantitation Data 可对每个study的蛋白定量结果进行分析和展示。其中行为基因(蛋白),列为样本,并可嵌入临床信息。可选择一个或多个study分析。该类分析的主要目的是根据蛋白丰度进行样本聚类分析,通过Tools菜单可实现。

8c03e0b47ed8b57c8a8bbee3affd530a.png

(2)Peptide Genome mapping

主要是各种类型数据在基因组上的可视化展示。

489c27d330ae95e0216464919543a818.png

(3)Pepquery

这是一个以肽段序列为中心的搜索,与Blast类似,Pepquery使用户能够在MS数据库中查询感兴趣的新的肽段或DNA序列。基因组改变导致产生新的蛋白序列,经过蛋白组学验证,这些新的序列可能会是潜在的疾病标志物或治疗靶标。Pepquery不需要定制化的构建数据库,区别于spectrum-centric的方法,使用peptide-centric,允许快速和方便的验证基因组改变导致的蛋白质组改变。

15045e7f6dc348c06f7ef88974d184b4.png

db199febe0962304a5f032151b5b97d1.png

(4)cProSite

可指定肿瘤类型和数据集,针对单个基因,分析其在肿瘤和癌旁组织的丰度差异,磷酸化位点差异等。可用于验证目标基因是否在指定类型肿瘤中存在高表达,磷酸化等。

36eafd0819956eb7a92e5b05dd74cb4a.png

d8205d561f5d81760d00a5fddc8c2dfe.jpeg

按照基因分析

除了在cProSite中查询单个基因,也可直接在首页搜索框输入目标基因,点击查看,或进入EXPLORE左侧Genes 筛选框输入一组基因或选择某个信号通路的基因,查询后进入右侧Genes页面查看。展示的信息包括:检测到的PTM,在不同study中的表达丰度。

858769915c4fc4a82724ae96e99ba7e4.png

6dfd22dddf87f86411e0257dac51a7a6.png

按照肿瘤类型分析

蛋白质组定量的结果形式与RNA定量结果类似,可进行的分析也类似。且相比于mRNA需要再经过翻译才能生成蛋白质,直接对蛋白定量的准确度更高。常规针对肿瘤样本和癌旁样本,进行差异表达,GO/KEGG注释,蛋白互作网络分析等。结合Clinical 标签数据,可进行生存分析,挖掘与临床病理或结果真正相关的标志物或靶点,通过机器学习方法可进行疾病分型,诊断预测等。

使用起来还是非常方便,避免了自己写代码,又找数据又作图,有需要的老师可以参考使用!

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出转录组系列生信分析教程,

敬请期待!!

有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!

4a425653faf7f48086ab4ac8183ecbea.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值