matlab fastaread,把fasta序列读入到R里面去

148935222_1_20181206083459731

你一定会遇到这个需求,把fasta序列读入到R里面,至于读进去变成一个字符串还是一个list还是一个对象,是后话!

本地读取

我这里先给几个本地读取的方法:

library(Biostrings) ;s = readDNAStringSet('nm.fasta')readBStringSet(filepath, format='fasta', nrec=-1L, skip=0L, seek.first.rec=FALSE, use.names=TRUE)library(seqinr); fastafile<>'proteins.fasta', seqtype = 'AA',as.string = TRUE)library(ape);read.dna();read.FASTA

在线获取

然后有几个包的在线获取方法也很赞!

用rentrez包也可以完成同样的任务.

首先用 entrez_link()根据基因的entrez ID来得到转录本的ID,然后根据转录本的ID用entrez_fetch()获取序列~

gene_ids <>351, 11647)linked_seq_ids <>'gene', id=gene_ids, db='nuccore')linked_transripts <>head(linked_transripts)all_recs <>'nuccore', id=linked_transripts, rettype='fasta')

读入到R里面是一个什么东西,就需要你仔细探究了。

class(all_recs)  ## 只是一个纯粹的 character 而已cat(strwrap(substr(all_recs, 1, 500)), sep='\n')write(all_recs, file='my_transcripts.fasta')temp <>## 编程技巧,把变量写入临时文件~write(all_recs, temp)parsed_recs <>

还是我前面说的,

http://www.biotrainee.com/thread-778-1-1.html

R语言初学笔记之吾日三省吾身!

其实你看到这一个简单的帖子,是因为我懒,但是对初学者来说,这里面的内容非常之多,值得学习的地方更是数不胜数,希望大家勇敢的学习这些技巧,然后在下面回帖写出自己的感悟!

其它推荐:http://www.biotrainee.com/thread-805-1-1.html ,R语言的protr包计算多条蛋白序列相似度 里面说到了用这个包的readFASTA函数也可以直接读取url的序列。■■   ■

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值