linux统计单拷贝基因家族,为什么所有病毒基因都是单拷贝

9de976efa6d8dc22392cece9bff4c705.png

第一章 基因的结构

第一节  基因和基因组

一、基因(gene)是合成一种功能蛋白或RNA分子所必须的全部DNA序列.

一个典型的真核基因包括

①编码序列—外显子(exon)

②插入外显子之间的非编码序列—内合子(intron)

③5'-端和3'-端非翻译区(UTR)

④调控序列(可位于上述三种序列中) 绝大多数真核基因是断裂基因(split-gene),外显子不连续。

二、基因组(genome) 一特定生物体的整套(单倍体)遗传物质的总和,基因组的大小用全部DNA的碱基对总数表示。人基因组3X1 09(30亿bp),共编码约10万个基因。每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-value Paradox)。

人类基因组计划(human genome project, HGP) 基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional genomics)。 蛋白质组(proteome)和蛋白质组学(proteomics)

第二节  真核生物基因组

一、真核生物基因组的特点:①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中.②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),

二、真核基因组中DNA序列的分类    •

(一)高度重复序列(重复次数>lO5)卫星DNA(Satellite DNA)

(二)中度重复序列

1.中度重复序列的特点

①重复单位序列相似,但不完全一样,

②散在分布于基因组中.

③序列的长度和拷贝数非常不均一,

④中度重复序列一般具有种属特异性,可作为DNA标记.

⑤中度重复序列可能是转座元件(返座子),

2.中度重复序列的分类

①长散在重复序列(long  interspersed repeated  segments.)    LINES

②短散在重复序列(Short  interspersed repeated  segments)    SINES

SINES:长度<500bp,拷贝数>105.如人Alu序列

LINEs:长度>1000bp(可达7Kb),拷贝数104-105,如人LINEl

(三)单拷贝序列(Unique Sequence)

包括大多数编码蛋白质的结构基因和基因间间隔序列,

三、基因家族(gene family)一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生。

基因家族的特点:①基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly repeated genes),如rRNA、tRNA和组蛋白的基因;②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene).Ψa1表示与a1相似的假基因.假基因分类。加工过的假基因(processed pseudogene)。

典型的基因家族

1.tRNA基因   单倍体人基因组中1300个tRNA基因,tRNA基因簇.

2.rRNA基因 >l00copy.rRNA基因簇(重复单元28S、18S、5.8s-rRNA)

3.组蛋白基因30-40copy.定位:7q32-q36 组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)特点:无intron,Poly(A)- RNA.

4.珠蛋白基因

α类:16p13,基因簇(24Kb):5’—ζ—Ψζ—Ψα1—α2—α1—3’

β类:11p15,基因簇(60Kb):5’— ζ—Gr—Ar—Ψβ—δ—β—3’

四、超基因家族(Supergene family ,Superfamily)

由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.

五、人类基因组中的重复序列标记

1、A1u序列

单倍体人基因组50万-100万拷贝,平均每隔3-6Kb就有一个Alu序列,

人A1u序列长300bp:

2X130bp重复序列;

+31bp间隔序列(中间);

两侧7-21bp正向重复(direct repeats),返座子?

Alu序列广泛散布于人基因组,约90%巳克隆的人基因合有Alu序列

Alu序列标志。

2、可变数串联重复    •    ,    •

Variable  number  tamdem  repeat, VNTR.

又称小卫星DNA(minisatellite DNA)

由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。

VNTR多态性—分子标记—DNA指纹图(fingerprint).

小卫星DNA突变与肿瘤,H-Ras。

3、短串联重复(short tandem repeat,STR)

又称微卫星DNA(microstallite DNA)

2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列,人基因组中每l0kb DNA序列至少一个STR序列。

{CA)n,50,000-100,000拷贝.

新一代遗传标记,人类基因组研究,肿瘤,遗传病.

第三节 线粒体基因组

人线粒体基因组的特点:

1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA).

2、线粒体DNA为母系遗传.

3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生.

4、mtDNA突变频率更高.

5、线粒体DNA突变的表型表达与核DNA不同。

第四节  细菌和病毒基因组

一、细菌基因组的特点。

1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构,

2.结构基因中没有内含子,也无重叠现象。

3.细菌DNA大部分为编码序列。

二、病毒基因组的特点

1.每种病毒只有一种核酸,或者DNA,或者RNA;

2.病毒核酸大小差别很大,3X103一3X106bp;

3.除逆病毒外,所有病毒基因都是单拷贝的。

4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成.

5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子.

6.有重叠基因.

第五节 染色质和染色体

细胞分裂间期—染色质(chromatin)

分裂期—染色体(chromosome)

一、染色质的基本单位—核小体

(一)核小体(nucleosome)结构

DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。

两个核小体核心颗粒之间有Linker DNA(0-80bp),

核小体核心颗粒+Linker=核小体(长180-210bp)

核小 体DNA Ladder.

(二)组蛋白(histone):一类小的带有丰富正电荷

组蛋白分类:

1.核小体核心组蛋白,H2A,H2B,H3,H4。分子量较小(102-135aa)

作用:盘绕DNA形成核小体 。

2.H1组蛋白:较大(220aa),作用:与Linker DNA结合后利于核小体稳定和更高级结构的形成•    。

二、染色质的高级结构

1、30nm染色质纤丝    ,

2、袢环结构(looped domain)    。

3、细胞分裂期染色体

分裂期染色体=一对姐妹染色单体(Chromatid)

有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)

三、染色体的结构要素    。

(一).着丝粒(centromere):细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。

(二).端粒(telomere):真核生物线状染色体分子末端的DNA区域

端粒DNA的特点:

1、由富含G的简单串联重复序列组成(长达数kb).

人的端粒DNA重复序列:TTAGGC。

2、端粒的末端都有一条12-16碱基的单链3’端突出。

端粒的作用:防止DNA末端降解,保证染色体的稳定性和功能

(三)、复制原点

◆◆

评论读取中....

请登录后再发表评论!

◆◆

修改失败,请稍后尝试

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值