R语言-生物序列处理——将excel中的序列合并成一个fasta文件

达芬奇文西

已于 2024-08-27 18:41:22 修改

阅读量256

点赞数 3

文章标签： r语言

于 2024-08-27 18:31:20 首次发布

本文链接：https://blog.csdn.net/TW756/article/details/141609258

版权

场景描述：现有一个存储序列（DNA序列或者蛋白序列）的Excel文件，将其中序列合并到一个fasta文件中。

序列在Excel中的存放格式如图所示：

Excel格式说明：表格的第一行是列名，序列从第二行开始放。第一列放序列名，第二列放序列。此sheet需要是Excel文件的第一个sheet，Excel文件命名为“序列表.xlsx.”

在D盘创建文件夹，命名为“1”；

代码如下：

library(readxl)
setwd("D://1")   #设定工作目录
aaa <- read_excel("序列表.xlsx",1) 

# 创建fasta文件写入流
fasta_file <- file("序列.fasta", "w")

for (i in 1:nrow(aaa)) {

  protein_name <- aaa[i, 1]  
  sequence <- as.character(aaa[i, 2])
  writeLines(paste(">", protein_name), fasta_file)
  writeLines(sequence, fasta_file)
}

# 关闭文件流
close(fasta_file)

※：需要安装过“readxl”包

运行代码，将在D://1中生成“序列.fasta”文件，任务完成。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

达芬奇文西

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
R语言-生物序列处理——将excel中的序列合并成一个fasta文件

第一列放序列名，第二列放序列。此sheet需要是Excel文件的第一个sheet，Excel文件命名为“序列表.xlsx.”：现有一个存储序列（DNA序列或者蛋白序列）的Excel文件，将其中序列合并到一个fasta文件中。运行代码，将在D://1中生成“序列.fasta”文件，任务完成。Excel格式说明：表格的第一行是列名，※：需要安装过“readxl”包。
复制链接

扫一扫