本周最新文献速递20211128

本周最新文献速递20211128

一、精细解读文献 一

文献题目: Deep learning enables genetic analysis of the human thoracic aorta

不想看英文题目: 基于深度学习的人类胸主动脉遗传学分析

杂志和影响因子: Nat Genet (IF: 38.33; Q1)

研究意义: 主动脉夹层和破裂是心源性猝死的重要原因,作者通过深度学习模型评估英国生物银行的 460 万张心脏磁共振成像中升主动脉和降主动脉的尺寸,并进行遗传学研究

结论:

  • 使用 U-Net 架构对心脏磁共振成像进行学习,总共手动标记了116张图像,其中 92 张图像用于训练,24 张用于验证。 利用该深度学习架构,验证集的主动脉和降主动脉识别准确率分别达到 96.5% 和 94.1%;
  • 基于前面训练的深度模型识别出来的升主动脉和降主动脉进行全基因组关联分析(GWAS) ,罕见变异分析、全转录组关联分析、单细胞 RNA 测序分析和主动脉疾病风险的多基因预测;

  • 对 43,243 名参与者的 4,374,900 张图像的升主动脉和降主动脉尺寸进行GWAS分析,发现了 82 个与升主动脉直径相关的独立位点, 47 个与降主动脉直径相关的独立位点。总共鉴定了 115 个基因座与升主动脉和降主动脉尺寸相关,其中 14 个基因座在这两种性状中均显着相关;

  • 为了复现前面的结果,作者使用弗雷明汉心脏研究(FHS)的 3287 名参与者进行重复验证, 由于 FHS 样本量比英国生物库样本量小一个数量级,因此作者采用 ** 效应值方向一致性 ** 评估重复性能。在升主动脉直径相关的 82 个独立位点中,72 个在 FHS 数据集中。其中 60 个在两个数据集中是方向一致的( P = 8.1 × 10-9)。在降主动脉直径相关的 47 个独立位点中,41 个在 FHS 数据集中。其中 36 个在两个数据集中是方向一致的( P = 7.8 × 10-7);
  • 对升主动脉和降主动脉进行遗传相关性分析,发现与血压有遗传相关(升主动脉直径 ldsc rg = 0.30; 降主动脉直径 ldsc rg = 0.17);
  • 对升主动脉和降主动脉进行全转录组关联研究 (TWAS),分别鉴定了 53 个和 15 个转录本与升主动脉和降主动脉直径显着相关。在升主动脉中关联最强的基因是 ULK4 ,该基因被报道与主动脉夹层相关;

  • 利用外显子组测序数据对 12,336 名英国生物银行参与者进行罕见变异关联分析,没有发现显着的变异,但将分析限制在 GWAS 基因座上下 500 kb 窗口时,发现 SVIL 中的罕见变异与降主动脉直径显著相关(P = 2.2 × 10 -4);
  • 为了探究主动脉 GWAS 基因座富集的细胞类型,作者收集了三个个体进行单细胞 RNA 测序分析(snRNA-seq),snRNA-seq 显示 SVIL、THSD4、WWP2 在主动脉内的血管平滑肌细胞中富集;

  • 为了探讨升主动脉 GWAS 基因座的临床意义,作者对升主动脉进行多基因评分,结果显示升主动脉与主动脉瘤或夹层事件密切相关(风险比 (HR) = 1.43 / sd,CI 1.32 - 1.54,P = 3.3 × 10 -20)。多基因评分前 10% 的参与者的主动脉瘤或夹层事件比其另外90%参与者的风险比 (HR) 高 2.1 倍(CI 1.8 - 2.6,P = 7.3 × 10 -15);

亮点: 全文都是很常规的分析,值得注意的是这篇文章重复集不用传统的阈值进行校正(0.05/显著snp数量或者FDR校正),而是采用效应值方向一致性进行重复性能评估,各位如果用传统的阈值重复不出来的话,可以考虑用这种方法。

局限: 没什么新意

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34837083/

公开的资料:

  • GWAS summary statistics:http://www.broadcvdi.org/
  • Single nucleus RNA sequencing:https://singlecell.broadinstitute.org/single_cell(accession no. SCP1265);https://www-ncbi-nlm-nih-gov-443.webvpn.bjmu.edu.cn/geo/query/acc.cgi?acc=GSE165824
  • 表型:dbgap, phs000007.v30.p11
  • code: https://github.com/carbocation/genomisc/tree/master/overlay

二、精细解读文献 二

注:以下文献采用“ White” 和 “Black” 进行称呼,翻译为中文就是白人和黑人,但这不代表本人的观点,更常见的叫法是欧裔祖先、非裔祖先、亚裔祖先等;

文献题目: Whole-genome analysis of Nigerian patients with breast cancer reveals ethnic-driven somatic evolution and distinct genomic subtypes

不想看英文题目: 尼日利亚乳腺癌患者的全基因组分析揭示了种族驱动的体细胞进化和不同的基因组亚型

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

研究意义: 与白人女性相比,散居在非洲的黑人女性患乳腺癌的风险更高,死亡率更高。虽然种族间生殖系突变是已知的,但尚未有研究详细阐明种族间体细胞进化差异。

结论:

  • 对 97 例患有乳腺癌的尼日利亚女性进行全基因组测序(WGS),并与癌症基因组图谱 (TCGA) 的 76 例乳腺癌病例进行比较。
  • 与白人和黑人组相比,尼日利亚组的插入和缺失(indel)负担更高(分别为 P = 6.5 × 10 -5和 P = 2 × 10 -4),单核苷酸(SNV) 突变率在种族间没有显着差异;
  • 使用 cDriver 和 MutSigCV 鉴定了 13 个驱动基因,GATA3 显示出最强的肿瘤抑制基因(TSG)信号;

  • 比较尼日利亚、黑人和白人组的非编码突变热点,发现有两个区域的突变率在尼日利亚组和白人组之间存在显着差异(FDR < 0.1)。第一个热点位于 20q13.2,其突变聚集在 ZNF217 的上游, ZNF217 基因编码转录因子,是肿瘤发生的关键调节因子,被报道与乳腺癌相关;第二个热点位于 SYPL1 区域,该基因被报道与肝细胞癌和胰腺导管腺癌相关;

  • 使用体细胞突变特征可解析乳腺癌的潜在的病因学。总共检测到 13 个单碱基替换 (SBS)信号,其中五个罕见的 SBS 信号,包括SBS17a/b、SBS7b、SBS15 和 SBS28 主要出现在尼日利亚和黑人群体中。此外,有 12 个 INDEL 信号被检测到,ID8 和 INDEL-B 在三个群体中较为普遍,但 INDEL-B 在白人群体中比尼日利亚和黑人群体少;

  • 对不同群体乳腺癌进行同源重组缺陷(HRD )分析,发现在任何群体或临床亚型中均未观察到显着的 HRD 富集。但与与黑人和白人组相比,尼日利亚 HR+ /HER2− 肿瘤亚型 HRD 较高;
  • 除了 HRD 分析,作者还进行了结构变异(SV)特征分析,总共提取了七个 SV 特征(S1-S7),其中 S3 在 BRCA1 型肿瘤中显著富集(14.5 倍;P = 1.1 × 10 -11),S2 在 BRCA2 型肿瘤中显著富集(2.8 倍;P = 4.5 × 10 -5),说明 INDEL 、SV 特征以及 HRD 评分可用于肿瘤的分类;

  • 对尼日利亚和白人组进行拷贝数变异(CNA)分析,发现尼日利亚组特有的 CNA 为 5p15.33-13.3 Gain、7p22.1–14.2 Gain、17p13.3 Gain 和 14q LOH,此外 14q LOH 在尼日利亚 HR-/HER2+ 肿瘤亚型中高度富集;

  • 基因组不稳定性(GI)是癌症的已知标志,对尼日利亚和白人组的 GI 进行比较,发现尼日利亚人的 GI 更高;
  • 使用 Plackett-Luce 重建肿瘤中所有基因组畸变的时间,基因组畸变包括 CNA、全基因组重复 (WGD)等。根据基因组畸变事件的时间顺序,GATA3和TP53 突变是最早出现的事件,除了GATA3和TP53,8p LOH、 17p LOH、9q34.2 LOH、14q LOH、15q14-q21.3 LOH 和 19p13.3 LOH 也是早期出现的基因组畸变事件;

  • 使用加权癌细胞分数 (wCCF) 评估肿瘤内异质性 (ITH),比起白人组,尼日利亚的 ITH 更高(P = 0.005);
  • 对突变和 CNA 事件进行成对相互作用分析,发现大多数 CNA 事件同时发生,但是 GATA3 和 TP53 突变几乎很少同时出现(P  = 2.46 × 10 -7);

  • 前面观察到 GATA3 和 TP53 突变几乎很少同时出现,说明 GATA3 和 TP53 突变可能表征了不同的癌症类型,因此,作者在尼日利亚队列中进一步表征 GATA3 和 TP53 突变相关的亚型。结果显示 GATA3 突变亚型的患者诊断年龄比其他亚型小10.5 岁(42.9 岁与 53.4 岁,P  = 4.8 × 10 -4),GATA3 阳性肿瘤患者比 TP53 阳性肿瘤患者有更低的拷贝数负荷;

文章链接:

https://www.nature.com/articles/s41467-021-27079-w

公开的资料:

  • sequencing data:https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs001687.v1.p1
  • TCGA raw sequencing data:https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000178.v11.p8

三、其他文献推荐

下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);


文献题目: Cell-type specialization is encoded by specific chromatin topologies

不想看英文题目: 细胞类型特异性由特定的染色质拓扑编码

杂志和影响因子: Nature (IF: 42.778; Q1)

文章链接:

https://www.nature.com/articles/s41586-021-04081-2


文献题目: A ubiquitous disordered protein interaction module orchestrates transcription elongation

不想看英文题目: 非结构化蛋白质相互作用模块协调转录延伸

杂志和影响因子: Science (IF: 41.845; Q1)

文章链接:

https://www.science.org/doi/10.1126/science.abe2913


文献题目: A benchmark study of simulation methods for single-cell RNA sequencing data

不想看英文题目: 单细胞RNA测序数据模拟方法的基准研究

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-27130-w


文献题目: Risk-stratification of febrile African children at risk of sepsis using sTREM-1 as basis for a rapid triage test

不想看英文题目: 使用 sTREM-1 对非洲发热儿童进行败血症风险分层

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-27215-6


文献题目: Hematopoiesis under telomere attrition at the single-cell resolution

不想看英文题目: 单细胞分辨率下端粒磨损的造血功能研究

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-27206-7


文献题目: Single-cell analysis identifies dynamic gene expression networks that govern B cell development and transformation

不想看英文题目: 单细胞分析鉴定控制 B 细胞发育和转化的动态基因表达网络

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-27232-5


文献题目: Molecular and phenotypic profiling of colorectal cancer patients in West Africa reveals biological insights

不想看英文题目: 西非结直肠癌患者的分子和表型分析揭示了生物学见解

杂志和影响因子: Nat Commun (IF: 14.92; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-27106-w


四、工具或资源类介绍


文献题目: Seq-SetNet: directly exploiting multiple sequence alignment for protein secondary structure prediction

不想看英文题目: Seq-SetNet:利用多序列比对进行蛋白质二级结构预测

杂志和影响因子: Bioinformatics (IF: 5.61; Q1)

文章链接:

https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab777/6444983?redirectedFrom=fulltext


文献题目: GPA-Tree: Statistical Approach for Functional-Annotation-Tree-Guided Prioritization of GWAS Results

不想看英文题目: GPA-Tree:对 GWAS 结果进行功能注释

杂志和影响因子: Bioinformatics (IF: 5.61; Q1)

文章链接:

https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab802/6443109?redirectedFrom=fulltext


致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感谢小可爱们多年来的陪伴, 我与你们一起成长~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值