在实验室做了很多的SRR,以及各种生物数据的操作,我觉得始终是处于一个混乱的状态
由此我将这篇文章作为实验室数据平台的人员使用,以及常用知识的普及,来给大家介绍下我们的数据工作,以及科普必要的知识!
1.DNA数据存储什么格式。
2.DNA序列获取方式
3.目前DNA种发现的研究 -eccdna,等一系列关于这些生物研究,我所理解的大概就是他们发现的最常见的研究让我们进行发现
4. 对于序列位点获取新的工具 bedtools,目前咱们自己要解决的提取数据方法
那么 开始介绍吧~
18年上半年的一篇研究人体eccDNA在nature上发表影响因子12.353
EccDNA首先由Alix Bassel和Yasuo Hoota发现,同时研究富兰克林斯塔尔的理论,即高等生物的染色体是由一系列DNA圈[ 1 ]于1964年制成的。使用主要研究来自重复序列的eccDNA的技术,一些小组试图确定哪些过程有助于形成eccDNA。EccDNA可以由小区[内的外源DNA来形成21 ]和以串联重复的DNA序列的组织预置成用于eccDNA的形成[该DNA 21 - 23 ]。总的来说,这些结果表明eccDNA的形成依赖于DNA序列,组织和DNA损伤修复。eccDNA定位于基因组中超过十万个独特位点,并富集在特定区域,热点,包括5'UTR区域和CpG区域,GC含量高的区域(60%)和转录活性染色质[ 27]]。
eccDNA的最新进展
eccDNA序列的染色体位置弱前列腺和卵巢癌细胞系彼此远离聚集,这表明eccDNA形成的位点可能与细胞谱系相关[ 28 ]。此外,在DNA错配修复途径中编码蛋白质的MSH3的缺失导致eccDNA水平降低80%[ 28]]。
这些研究共同表明,eccDNA可通过增加癌基因的拷贝数来促进肿瘤的异质性和肿瘤的进化[ 28 ]。
人类与鼠的eccDNA鉴定显示,eccDNA大小在0.1-2kb范围内,且主要来源于外显子以及5’端非翻译区。
EccDNA提取与测序 EccDNA测序数据分析
EccDNA研究结果
我们发现EccDNA具有转录活性,认为EccDNA通过全长和/或基因片段的表达促使产生表型变异。
基于Circle-Seq方法的EccDNA比对
质粒和重复序列上的EccDNA大小与reads分布
EccDNA断裂点的基因组分布
EccDNA 验证与DNA 缺失
来自[HIP1circle exon 1]的EccDNA的转录本