MATLAB中gag,华侨大学课件系列:matlab(生物信息学学习).pdf

华侨大学课件系列:matlab(生物信息学学习)

Matlab生物信息学工具包

Bioinformatics

MatLab Bioinformatics Toolbox

(1)Data Formats and Databases

①getgenbank和genbankread

例1:S = getgenbank('M10051')

返回:S =

例2 :mitochondria =

getgenbank('NC_001807','SequenceOnly',true)

返回:

mitochondria =

gatcacaggtctatcaccctattaaccactcacgggagctctccatgcat

ttggtattttcgtctggggggtgtgcacgcgatagcattgcgagacgctg

gagccggagcaccctatgtcgcagtatctgtctttgattcctgcctcatt

ctattatttatcgcacctacgttcaatattacaggcgaacatacctacta

aagt . . .

例:getgenbank('nm_000520', 'ToFile',

'TaySachs_Gene.txt')

s = genbankread('TaySachs_Gene.txt')

返回:s=

LocusName:"NM_000520'

LocusSequenceLength:'2255'

LocusNumberofStrands:''

LocusTopology:'linear'

LocusMoleculeType:'mRNA'

LocusGenBankDivision:'PRI'

LocusModificationDate:'23-SEP-2005'

………………

例1:

seq = getgenbank('NM_000546')

codingSeq = seq.Sequence(203:1384)

fastawrite('p53coding.txt','Coding region for p53',codingSeq);

例2 :p53nt = fastaread('p53coding.txt')

例3 :Save multiple sequences.

data(1).Sequence = 'ACACAGGAAA'

data(1).Header = 'First sequence'

data(2).Sequence = 'ACGTCAGGTC'

data(2).Header = 'Second sequence'

fastawrite('my_sequences.txt', data)

type('my_sequences.txt')

(2)Sequence Conversion

①aa2nt 和nt2aa

②nt2int 和int2nt ;aa2int 和int2aa

③dna2rna 和rna2dna

④baselookup 和aminolookup

⑤seqcomplement

⑥seqreverse

⑦seqrcomplement

MatLab生物信息学平台统计的函数

1.basecount(count nucleotides in a sequence)

例:bases = basecount('TAGCTGGCCAAGCGAGCTTG')

答案:bases =

A: 4

C: 5

G: 7

T: 4

2.dimercount(count dimers in a sequence)

例:dimercount('TAGCTGGCCAAGCGAGCTTG')

答案: ans =

AA: 1

AC: 0

AG: 3

AT: 0

CA: 1

CC: 1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值