Easyseq v1.0 核酸序列处理工具

风中飞鸟

已于 2024-08-04 12:42:00 修改

阅读量575

点赞数 18

分类专栏： EasySeq 文章标签： perl

于 2024-08-04 12:00:25 首次发布

本文链接：https://blog.csdn.net/AA1011011001/article/details/140904087

版权

9 篇文章 0 订阅

订阅专栏

每当我抵达一个我自认为的处女之地，却总发现早已有人在此等待，以我微不足道的能力向先驱者致以最为崇高的敬意。 -题记

————————————————————————————————————————————————————————————————————————————————————

在之前的工作中，因为要确认设计的PCR引物对于不同物种的覆盖情况，要处理大量的核酸序列，在工作的过程中及复盘中，总结出了一些工作流程，并编写为该套工具，实现序列截取、PCR扩增子的获取、靶标位点不匹配碱基分析的功能。希望我微不足道的工作，能为有同样需求的朋友带来帮助。

由于技术能力有限，本工具采取了不同源文件放置在不同文件夹里面的策略，并根据扩展名进行识别，

Easyseq v1.0工具基于脚本程序编译而成，作为Windows平台核酸序列操作工具使用；主要功能为序列过滤、截取、扩增子获得、引物探针突变位点分析；并集成了一个简易引物探针分析pipeline；

重要提示：所有程序及文件组成请放在1级目录下（如E:\Easyseq\[文件目录及脚本程序]），最好打开计算机的显示文件扩展名功能，以方便使用，待处理的文件路径请勿存在中文或下划线等符号，处理的文件最好只有一个单词命名，处理后的文件名如需进一步处理，请勿修改文件名；

序号	名称	作用
1	pmt.filter	各类参数的储存文件，所有处理的基础
2	[0]filter	基于参数文件进行数据过滤
3	[1]match	基于过滤数据进行引物探针比对
4	[2]classify	根据参数列表文件对数据进行分类
5	[3]maplus	根据参数列表文件对扩增子及引物探针匹配位置序列进行提取
6	[4]mutation	根据引物探针匹配位置碱基序列进行突变分析
7	[5]extract_id	提取参数文件提取数据库中所含列表文件ID
8	[6]cut	根据参数文件对目标序列进行截取
9	[7]mismatch	根据mismatch文件输出突变碱基位点

#pmt.filter可使用文本格式打开

3.2简易pipeline

3.2单独功能

	数据储存目录		处理结果
单独使用	database\*.fa	→[0]filter→	filtered\*.filtered
简易pipeline	database\*.fa	→[1]match→	matched\.matched matched\.unmatched
	matched\*.unmatched	→[2]classify→	classified\*.fa
	classified\*.fa	→[3]maplus→	mapped\*.hit
	mapped\*.hit	→[4]mutation→	mutation\分析结果
单独使用	matched\.	→[5]extract_id→	extract_id\[species_name].id
单独使用	database\*.fa	→[6]cut→	cutted\database.cutted
单独使用	mismatch\*.mismatch	→[7]mismatch→	mismatch\分析结果