dbeaver 数据转化 mapping_优博视窗|周强伟:DNA 甲基化数据分析相关软件开发及应用...

DNA 甲基化数据分析相关软件开发及应用

Development and Application of DNA Methylation Data Analysis

Software

作者:周强伟

指导老师:李国亮 教授

学院:信息学院

专业:生物信息学

研究背景及意义

表观遗传学修饰在细胞发育、分化以及癌症等疾病中具有关键的作用,其中 DNA甲基化是最重要的表观修饰之一。已有研究表明,DNA 甲基化在植物免疫、人类心血管疾病、动脉粥样硬化、自闭症、神经退行性疾病以及肿瘤治疗和肾脏老化等方面都起到非常重要的作用。因此研究全基因组 DNA 甲基化图谱对于解析 DNA 甲基化的分布、作用机制以及 DNA 甲基化与相关疾病的作用关系具有非常重要的意义。

主要研究内容

689ee6e2-101f-eb11-8da9-e4434bdf6706.png

本文主要根据目前 DNA 甲基化研究领域的需求,开发了 DNA 甲基化分析流程软件-BatMeth2,SNP 检测工具 BSsnpcall 以及 DNA 甲基化单倍型组装软件 methyhaplo。在最后一章节中,介绍了 BatMeth2 在实际数据中的应用分析。本文各章节的组织结构如下所示:

第一章,绪论。首先介绍了本文的研究背景和意义,然后介绍了当前 DNA 甲基化领域的研究进展,讨论了 DNA 甲基化数据分析软件的详情,最后介绍了本文的主要内容安排。

第二章,重亚硫酸盐 DNA 甲基化数据精准比对分析流程软件包。首先介绍了在BatMeth 的基础上结合新的比对算法 BatAlign,将比对性能进行了完善与提升。其次介绍了本研究中开发的包含目前 DNA 甲基化领域需求的分析工具,其中包括 DNA 甲基化水平的计算、DNA 甲基化在基因等功能元件的分布、DNA 甲基化的可视化以及DNA 甲基化差异分析等。最后提供了一键式简便操作的软件流程包 BatMeth2。

第三章,DNA 甲基化数据中检测 SNP 的工具-BSsnpcall。在该章节介绍了本研究中开发的一款高效且准确度高的 SNP 检测工具,该软件结果与目前已有软件相比无论在速度还是结果准确性上都有十分明显的提高。

第四章,DNA甲基化单倍型组装工具以及等位差异 DNA甲基化检测工具的开发。根据 DNA 甲基化信息以及 SNP 信息分布,开发了单倍型组装工具 MethyHaplo。该程序可以结合 DNA 甲基化信息以及 SNP 信息来完成单倍型组装工作,并且可以得到等位差异 DNA 甲基化结果。

第五章,DNA 甲基化分析流程软件的应用。应用第二章开发的 BatMeth2,分析水稻中不同编码 DNA甲基化酶的基因突变情况下,DNA甲基化的变化,分析了水稻中的DNA 甲基化分布模式以及 OsDRM2 以及 OsDDM1 等蛋白对 DNA 甲基化修饰的调控范围和可能的作用机制。此外,本章节中分析了水稻中 small RNA(sRNA)以及组蛋白修饰 H3K27me3、H3K9me3 与 DNA 甲基化之间的关系。

第六章,总结与展望。在本章节中,对前文介绍的 DNA 甲基化数据分析以及软件开发工具的结果进行了总结,并进一步对 DNA 甲基化的研究发展做出了展望。

总结与展望

随着 DNA 甲基化更深入的研究,可以更好的理解 DNA 甲基化在正常发育以及疾病治疗中存在的深远影响。

本文第二章节中介绍了本研究中开发的一款操作简便,包含数据预处理、序列比对、DNA 甲基化水平计算、DNA 甲基化在基因等功能元件甲基化水平和可视化分布、DNA甲基化差异分析、DNA甲基化可视化等功能的一键式操作流程包 BatMeth2。并且BatMeth2 会根据结果自动生成一个直观的 HTML 文件,其中包含了运行参数、输出文件、DNA 甲基化整体水平以及 DNA 甲基化在基因组水平分布等可视化结果。首先,BatMeth2 的比对软件能够更精确的完成序列比对,尤其是 Indel 区域附近的序列比对。其次在 DNA 甲基化差异分析过程中,BatMeth2 能够根据是否存在实验重复选择合适的算法。最后,BatMeth2 生成一系列直观的可视化结果以及 bed、bigwig等方便基因组浏览器查看的文件格式。尽管如此,BatMeth2 仍旧存在一些需要进一步完善更新的功能。首先,在存在批量 DNA 甲基化数据时,如果需要同时运行 BatMeth2 软件,这难免对使用者来说是一件非常麻烦的事情。因此后续会添加一个配置文件,用户可以在配置文件中准备好要分析的数据, BatMeth2 可以批量完成分析。此外,在 DNA 甲基化差异分析功能中,存在实验重复的情况下 BatMeth2 应用贝塔二项式分布来检测差异,然而在不存在重复时,BatMeth2 应用 Fisher 检验来检测差异。但是 Fisher 检验往往存在一定比例的假阳性结果,目前针对缺少实验重复的情况 DSS-Single 会根据检测区域上下游的范围来评估离散情况作为重复值进一步检测差异。后期需要更进一步考虑在不存在实验重复的情况下如何精确的进行 DNA 甲基化差异分析。

在第三章中介绍了本研究中开发的一款 DNA 甲基化数据中检测 SNP 的工具BSsnpcall,该软件结合不同的 SNP 情况以及 DNA 甲基化情况使用新的 bayes 模型完成SNP 的检测。与目前存在的软件相比,BSsnpcall 具有更高的检测精确度,检测结果准确率比其他软件高 5%-25%,此外该软件同样具有更高的检测效率,所需要的运行时间分别只是其他软件的 1/2 以及 1/70。目前常见的单倍型组装是通过基因组上的 SNP 信息作为区分单倍型的信息来完成组装,但是 DNA 甲基化也是作为区分单倍型的重要信息之一。本文第四章节中介绍了本研究中开发的 DNA 甲基化单倍型组装工具以及检测等位差异 DNA 甲基化工具methyhaplo。结果表明整合 DNA 甲基化信息与 SNP 信息后,单倍型组装结果长度是仅用 SNP 信息组装单倍型结果的 10 倍。此外,DNA 甲基化能够使得更多的 SNP 连接到一起,有助于更好的完成 SNP 相关分析。通过查看等位差异 DNA 甲基化的分布,发现等位差异 DNA 甲基化主要集中在外显子区域,并且在基因转录起始位置有明显富集。结合转录组数据分析发现,等位差异 DNA 甲基化主要分布在高表达的基因上。进一步结合组蛋白修饰数据结果显示,等位差异 DNA 甲基化在与激活相关的组蛋白修饰上有更高的富集。CTCF 是非常关键的转录调控因子,并且受 DNA 甲基化的影响。结合CTCF 数据显示等位差异 DNA 甲基化与等位差异 CTCF 之间存在显著的富集。

最后,在本文第五章中,本研究将第二章介绍的 BatMeth2 软件应用到了水稻 DNA甲基化全基因组测序数据中。一方面本研究中将分析结果与之前已有结果进行比较,验证了 BatMeth2 结果的准确性。另一方面,在该数据基础上进一步深入分析,探讨了水稻中几种 DNA 甲基化相关的基因突变体与野生型相比的 DNA 甲基化水平变化情况。结果展示了 OsDRM2 以及 OsDDM1 的作用范围以及可能的调控机制,并且分析了水稻中独特的 CHH 调控机制。

代表性创新成果

1.Qiangwei Zhou, Jing-Quan Lim, Wing-King Sung*, Guoliang Li*. An integrated package for bisulfite DNA methylation data analysis with Indel-sensitive mapping. BMC Bioinformatics. 2019, 10.1186/s12859-018-2593-4

2. Feng Tan#, Chao Zhou#, Qiangwei Zhou#, Shaoli Zhou, Wenjing Yang, Yu Zhao, Guoliang Li, and Dao Xiu Zhou*. Analysis of Chromatin Regulators Reveals Specific Features of Rice DNA Methylation Pathways. Plant Physiology, 2016, 171(3):2041-2054 (#, Equal contribution)

3. Shaoli Zhou#, Xiaoyun Liu#, Chao Zhou#, Qiangwei Zhou, Yu Zhao, Guoliang Li, Daoxiu Zhou*. Cooperation between the H3K27me3 chromatin marker and non-CG methylation in epigenetic regulation. Plant Physiology, 2016, 172(2):1131-1141 (#, Equal contribution);

4. Chao Zhou, Changshi Wang, Hongbo Liu, Qiangwei Zhou, Qian Liu, Yan Guo, Ting Peng, Jiaming Song, Jianwei Zhang, Lingling Chen, Yu Zhao, Zhixiong Zeng*, Dao Xiu Zhou*. Identification and analysis of adenine N6-methylation sites in the rice genome. Nature Plants, 2018, 4(8): 554-563.

5. Guoliang Li*, Liuyang Cai, Huidan Chang, Ping Hong, Qiangwei Zhou, Ekaterina V Kulakova, Nikolay A Kolchanov and Yijun Ruan. Chromatin Interaction Analysis with Paired-End Tag (ChIA-PET) sequencing technology and application. BMC genomics, 2014, 15 Suppl 12(Suppl 12), S11.

699ee6e2-101f-eb11-8da9-e4434bdf6706.png

来源|研究生院

编辑|白聪

审核|宋丽波

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值