grep表示搜索命令 查找fasta文件中有多少条序列 grep ">" 文件
grep ">" 文件 |
wc 表示找出大于号的行并且输出行即为序列数目
grep -v ">" 文件 表示输出不含大于号的行(加 -v表示反选)
找哪些文件是属于自己用户的文件
ls -l |grep "用户名“
sed 流处理器
sed -e 's/H37Rv_//' H37Rv.fna | grep
">" 表示将H37Rv.fna
的文件删除并且找出含有>的行
sed -e 's/H37Rv_//' H37Rv.fna | le
表示将H37Rv.fna 的文件删除并且显示
sed -e 's/H37Rv_//' H37Rv.fna 只表示对H37Rv.fna
处理不显示
sed -i 's/H37Rv_//' H37Rv.fna 表示在原文件上进行修改(谨慎使用)
1.采用sed命令将fastq数据转化为fasta 格式,命令如下:
sed -e '0~4d' fastq文件 | sed -e ‘0~3d’ | sed -e
‘s/@/>/' 将
fastq文件转化为fasta格式并且输出
sed -e '0~4d' fastq文件 | sed -e ‘0~3d’ | sed -e ‘s/@/>/' >文件名1 将fastq文件转化为文件名1的fasta文件并且保存 查看只需要 less 文件名1即可
2.sed 可以输出一个文件的任一行
sed -n '数字' 文件 可以输出文件的数字表示的行
sed -n ‘数字1,数字2p' 可以输出数字1到数字2之间的行
3.awk亦可以将fastq格式转化为fasta格式,命令如下:
awk '{getline seq;getline plus;getline
qual;sub("@",">",$0);print $0 "\n"seq}' reads.1.fastq
>read.2.awk.fasta
将read.1.fastq转化为read.2.awk.fasta并且保存。
awk可以输出结果的哪一列,格式为:
awk '{print $0}'
blast_m8.out $n n表示数字,表示要输出的列 $0则表示所有的列即一整行。
awk也可以条件输出,如:awk '{if ($3>80 && $4>=100) print
$0}' blast_m8.out | le
表示输出blast_m8的第三列大于80并且第四行大于等于100的结果。
awk '{if ($3>80 && $4>=100)
print $1}' blast_m8.out|sort -n -k2|uniq|wc
输出blast_m8的第三列大于80并且第四行大于等于100的结果并且将其排序(按照第一列的第二项?)并且去重复取唯一的并且统计列数,最终得到了匹配的符合条件的个数。
find在当前目录内查找 grep 表示文件内查找
格式 find 要查找的目录 查找的条件 eg.find
./ -name ‘*.sh'
find ./ amin
5查找最近5min被编辑过的文件
find ./ -size 1500b 找出大于1500b的文件
find ./ 1500b |
xargs rm 管道后加xargs
rm 将查到的文件一次性删除
有好多基因组序列要生成
样品名=每个序列文件的路径 find +awk +sed+ 重定向完成
find .-name *.fna | sed -e
's#\.#/share/genomics/work/0.Shell/genome#1' |awk -F''/'' '{print
$7"="$0}' | sed -e 's/_uid.*=/=/1'