Matlab获取线粒体序列及核苷酸初步分析

这篇博客介绍了如何利用Matlab从NCBI获取线粒体基因组序列,并进行核苷酸密度、成分、配对补足、密码子分布等分析。博主展示了获取NC_012920线粒体序列的过程,并通过ntdensity、basecount、dimercount和codoncount等函数进行不同层面的分析,包括原始序列和反向阅读框的密码子计数。
摘要由CSDN通过智能技术生成

1.matlab访问NCBI

>> web('http://www.ncbi.nlm.nih.gov/')

 2.查询线粒体基因组:mitochondrion homo sapiens , 

Accession:   NC_012920.1        GI :  251831106

3. matlab获取线粒体序列信息


>> mitochondria = getgenbank('NC_012920','SequenceOnly',true);

 

3.1 线粒体序列大小信息:

>> mitochondria = getgenbank('NC_012920','SequenceOnly',true);

>> whos mitochondria
  Name              Size               Bytes  Class    Attributes

  mitochondria      1x16569            33138  char               

4. 核苷酸成分分析:

4.1 单体密度和联合单体密度曲线图

>> ntdensity(mitochondria)

 

 

 

4.2 计数核苷酸

>> basecount(mitochondria)

ans =

  包含以下字段的 struct:

    A: 5124
    C: 5181
    G: 2169
    T: 4094

4.3计数核苷酸序列的配对补足

>> basecount(seqrcomplement(mitochondria))

ans =

  包含以下字段的 struct:

    A: 4094
    C: 2169
    G: 5181
    T: 5124

 

4.4 核苷酸成分分布

>> basecount(mitochondria,'chart','pie')

ans =

  包含以下字段的 struct:

    A: 5124
    C: 5181
    G: 2169
    T: 4094

 

 

 

4.5 计数二聚物并条形图展示

>> dimercount(mitochondria,'chart','bar')

ans =

  包含以下字段的 struct:

    AA: 1604
    AC: 1495
    AG: 795
    AT: 1230
    CA: 1534
    CC: 1771
    CG: 435
    CT: 1440
    GA: 613
    GC: 711
    GG: 425
    GT: 419
    TA: 1373
    TC: 1204
    TG: 513
    TT: 1004

 

 

 

 

5.计数密码子成分

5.1计数核苷酸序列中的密码子

>> codoncount(mitochondria)
AAA - 167     AAC - 171     AAG -  71     AAT - 130     
ACA - 137     ACC - 191     ACG -  42     ACT - 153     
AGA -  59     AGC -  87     AGG -  51     AGT -  54     
ATA - 126     ATC - 131     ATG -  55     ATT - 113     
CAA - 146     CAC - 145     CAG -  68     CAT - 148     
CCA - 141     CCC - 205     CCG -  49     CCT - 173     
CGA -  40     CGC -  54     CGG -  29     CGT -  27     
CTA - 175     CTC - 142     CTG -  74     CTT - 101     
GAA -  67     GAC -  53     GAG -  49     GAT -  35     
GCA -  81     GCC - 101     GCG -  16     GCT -  59     
GGA -  36     GGC -  47     GGG -  23     GGT -  28     
GTA -  43     GTC -  26     GTG -  18     GTT -  41     
TAA - 157     TAC - 118     TAG -  94     TAT - 107     
TCA - 125     TCC - 116     TCG -  37     TCT - 103     
TGA -  64     TGC -  40     TGG -  29     TGT -  26     
TTA -  96     TTC - 107     TTG -  47     TTT -  78   

 

5.2 计数所有六个阅读框的密码子

>> for frame = 1:3
figure ('color',[1 1 1])

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值