linux
文章平均质量分 54
liuwei6843
这个作者很懒,什么都没留下…
展开
-
mNGS(宏基因组)_分析流程
30指的是要求PE的两条read同时和PE的adapter序列比对,匹配度加起来超30%,那么就认为这对PE的read含有adapter,并在对应的位置需要进行切除【注】。10和前面的30不同,它指的是,我就什么也不管,反正只要这条read的某部分和adpater序列有超过10%的匹配率,那么就代表含有adapter(接头)了,需要进行去除。【注】测序的时候往往只会在测到一些部分的adapter,因此read和adaper的时候肯定是不需要要求百分百匹配率的,上述30%和10%其实是比较推荐的值。原创 2024-09-05 23:48:05 · 736 阅读 · 0 评论 -
文本处理三剑客_grep
【代码】文本处理三剑客_grep。原创 2024-09-05 23:35:06 · 91 阅读 · 0 评论 -
文本处理三剑客_awk
第7列字段不包含root尾巴的行,打印第1列和第7列。打印第1列内容,并在后面加上"打印每一行的行号,行号是从1开始,不是0。第1列字段包含root的行,打印出来。打印最后一行的行号(即显示总行数)两个文件打印行号,分别从1开始。+、-、*、/:加、减、乘、除。打印第二行,print可省略。以root开头的行打印出来。打印行号和每一行的内容。打印第二行的最后一列。原创 2024-09-05 23:31:21 · 306 阅读 · 0 评论 -
linux常用命令
【代码】linux常用命令。原创 2024-09-05 18:56:02 · 184 阅读 · 0 评论 -
shell_bash相关知识笔记
当你在命令中使用反引号包围一个命令时,这个命令会在执行后被替换为其标准输出。这样可以将命令的输出赋值给变量,或者将其作为另一个命令的参数使用。原创 2024-09-05 18:40:29 · 209 阅读 · 0 评论 -
在linux环境中进行文件归档和压缩
gunzip 命令用于解压缩 .gz 文件。原创 2024-09-05 18:03:24 · 225 阅读 · 0 评论 -
使用prodigal预测基因
prodigal可用于对基因组核苷酸文件(.fna) 进行预测基因,可以生成基因的核苷酸格式文件、氨基酸格式文件和结构注释文件。-f #默认是gbk格式,选择gff格式会使out.gff文件的格式更可读。-p #数据类型,single or meta。-o #基因结构注释文件, 输出基因位置等信息。-d #预测的基因的核苷酸文件。-a #预测的基因蛋白质文件。直接对输出文件重命名了!原创 2024-09-05 17:27:34 · 175 阅读 · 0 评论 -
linux_生信相关知识笔记
qcovus, 即 query coverage per uniq subject,qcovus计算所采用的也是一对query/subject所有HSP query length之和除以query序列的总长度,但其query length之和的计算方法,不再是简单地将所有HSP的query length相加,而是要去除掉不同HSP的query length之间的重叠部分。HSP是high scoring pair的首字母缩写,BLAST结果中的每一行就是一个HSP。echo相当于print。原创 2024-06-10 21:14:43 · 957 阅读 · 0 评论