linux下，如何从保存多条基因数据的.fa文件中提取特定的一条基因数据？

最新推荐文章于 2024-05-25 20:30:10 发布

weixin_33877885

最新推荐文章于 2024-05-25 20:30:10 发布

阅读量2.2k

点赞数

文章标签：操作系统

原文链接：https://segmentfault.com/a/1190000014346504

版权

先描述我的项目内容：

将50bp长的DNA序列进行单次比对（linux环境，算法gapmis已经写好）；
500万个基因序列文件单次比对，会耗费大量I/O时间。为此希望将1万条基因数据保存在一个AT50_1_0.fasta文件中，每一条基因数据单独保存为一行，如下图所示：
依次提取各行数据，并调用比对算法gapmis，输出每一行的比对结果。

“将包含一条基因数据的文件依次进行比对，转化成二维数据进行比对”，直接目前存在的问题：

linux环境下，是否可以编写c循环程序：对.fa中的文件按行读取？
“.fa”文件格式说明：按照“>”标识来界定是否为一条基因数据。如果只有一个“>”，判定只存在一条基因数据；
gapsmis程序在linux环境下的比对命令为："./gapsmis -a a.fasta -b b.fasta" （将序列a与序列b进行比对）。换句话说：我们需要修改gapsmis程序接口，将命令中的“文件名”输入形式，转换为“基因字符串”输入形式。

（具体解决

最低0.47元/天解锁文章

weixin_33877885

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
linux下，如何从保存多条基因数据的.fa文件中提取特定的一条基因数据？

先描述我的项目内容：将50bp长的DNA序列进行单次比对（linux环境，算法gapmis已经写好）；500万个基因序列文件单次比对，会耗费大量I/O时间。为此希望将1万条基因数据保存在一个AT50_1_0.fasta文件中，每一条基因数据单独保存为一行，如下图所示：依次提取各行数据，并调用比对算法gapmis，输出每一行的比对结...
复制链接

扫一扫

weixin_33877885 CSDN认证博客专家 CSDN认证企业博客

码龄8年

145: 原创

-: 周排名

115万+: 总排名

132万+: 访问

: 等级

7770: 积分

4734: 粉丝

287: 获赞

14: 评论

1535: 收藏

私信

关注

热门文章

最新评论

开源机器人自学指南
m0_74009607: 没学过控制，没学过C,C++.实验室第一个做机器人的，所以我的结局是延毕吗
开源机器人自学指南
one-young-coder: 说的太好了，很可惜很多大三就该掌握的东西，到了毕业多年都不去研究，甘当螺丝钉
Freecad的Python脚本
迈克杰克骚: 你好，我想请问为啥我从第一个创建新空白文档，代码就报错啊
koa上传excel文件并解析
要饭啦: 请问errorResult.js这个文件有吗
Freecad的Python脚本
catdrinkcola: 你好，请问我想看FreeCAD的倒角模块的底层源码和UI界面的源码可以看到吗？我找了好久都没有找到，只找到了C++源码。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。