1.matlab访问NCBI
>> web('http://www.ncbi.nlm.nih.gov/')
2.查询线粒体基因组:mitochondrion homo sapiens ,
Accession: NC_012920.1 GI : 251831106
3. matlab获取线粒体序列信息
>> mitochondria = getgenbank('NC_012920','SequenceOnly',true);
3.1 线粒体序列大小信息:
>> mitochondria = getgenbank('NC_012920','SequenceOnly',true);
>> whos mitochondria
Name Size Bytes Class Attributes
mitochondria 1x16569 33138 char
4. 核苷酸成分分析:
4.1 单体密度和联合单体密度曲线图
>> ntdensity(mitochondria)
4.2 计数核苷酸
>> basecount(mitochondria)
ans =
包含以下字段的 struct:
A: 5124
C: 5181
G: 2169
T: 4094
4.3计数核苷酸序列的配对补足
>> basecount(seqrcomplement(mitochondria))
ans =
包含以下字段的 struct:
A: 4094
C: 2169
G: 5181
T: 5124
4.4 核苷酸成分分布
>> basecount(mitochondria,'chart','pie')
ans =
包含以下字段的 struct:
A: 5124
C: 5181
G: 2169
T: 4094
4.5 计数二聚物并条形图展示
>> dimercount(mitochondria,'chart','bar')
ans =
包含以下字段的 struct:
AA: 1604
AC: 1495
AG: 795
AT: 1230
CA: 1534
CC: 1771
CG: 435
CT: 1440
GA: 613
GC: 711
GG: 425
GT: 419
TA: 1373
TC: 1204
TG: 513
TT: 1004
5.计数密码子成分
5.1计数核苷酸序列中的密码子
>> codoncount(mitochondria)
AAA - 167 AAC - 171 AAG - 71 AAT - 130
ACA - 137 ACC - 191 ACG - 42 ACT - 153
AGA - 59 AGC - 87 AGG - 51 AGT - 54
ATA - 126 ATC - 131 ATG - 55 ATT - 113
CAA - 146 CAC - 145 CAG - 68 CAT - 148
CCA - 141 CCC - 205 CCG - 49 CCT - 173
CGA - 40 CGC - 54 CGG - 29 CGT - 27
CTA - 175 CTC - 142 CTG - 74 CTT - 101
GAA - 67 GAC - 53 GAG - 49 GAT - 35
GCA - 81 GCC - 101 GCG - 16 GCT - 59
GGA - 36 GGC - 47 GGG - 23 GGT - 28
GTA - 43 GTC - 26 GTG - 18 GTT - 41
TAA - 157 TAC - 118 TAG - 94 TAT - 107
TCA - 125 TCC - 116 TCG - 37 TCT - 103
TGA - 64 TGC - 40 TGG - 29 TGT - 26
TTA - 96 TTC - 107 TTG - 47 TTT - 78
5.2 计数所有六个阅读框的密码子
>> for frame = 1:3
figure ('color',[1 1 1])