matlab fastaread,把fasta序列读入到R里面去

最新推荐文章于 2024-05-18 11:13:56 发布

丁香医生

最新推荐文章于 2024-05-18 11:13:56 发布

阅读量553

点赞数

文章标签： matlab fastaread

148935222_1_20181206083459731

你一定会遇到这个需求，把fasta序列读入到R里面，至于读进去变成一个字符串还是一个list还是一个对象，是后话！

本地读取

我这里先给几个本地读取的方法：

library(Biostrings) ;s = readDNAStringSet('nm.fasta')readBStringSet(filepath, format='fasta', nrec=-1L, skip=0L, seek.first.rec=FALSE, use.names=TRUE)library(seqinr); fastafile<>'proteins.fasta', seqtype = 'AA',as.string = TRUE)library(ape);read.dna();read.FASTA

在线获取

然后有几个包的在线获取方法也很赞！

用rentrez包也可以完成同样的任务.

首先用 entrez_link()根据基因的entrez ID来得到转录本的ID，然后根据转录本的ID用entrez_fetch()获取序列~

gene_ids <>351, 11647)linked_seq_ids <>'gene', id=gene_ids, db='nuccore')linked_transripts <>head(linked_transripts)all_recs <>'nuccore', id=linked_transripts, rettype='fasta')

读入到R里面是一个什么东西，就需要你仔细探究了。

class(all_recs) ## 只是一个纯粹的 character 而已cat(strwrap(substr(all_recs, 1, 500)), sep='\n')write(all_recs, file='my_transcripts.fasta')temp <>## 编程技巧，把变量写入临时文件~write(all_recs, temp)parsed_recs <>

还是我前面说的，

http://www.biotrainee.com/thread-778-1-1.html

R语言初学笔记之吾日三省吾身！

其实你看到这一个简单的帖子，是因为我懒，但是对初学者来说，这里面的内容非常之多，值得学习的地方更是数不胜数，希望大家勇敢的学习这些技巧，然后在下面回帖写出自己的感悟！

其它推荐：http://www.biotrainee.com/thread-805-1-1.html ，R语言的protr包计算多条蛋白序列相似度里面说到了用这个包的readFASTA函数也可以直接读取url的序列。■■ ■

丁香医生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
matlab fastaread,把fasta序列读入到R里面去

你一定会遇到这个需求，把fasta序列读入到R里面，至于读进去变成一个字符串还是一个list还是一个对象，是后话！本地读取我这里先给几个本地读取的方法：library(Biostrings);s=readDNAStringSet('nm.fasta')readBStringSet(filepath,format='fasta',nrec=-1L,skip=0L,seek.first....
复制链接

扫一扫