linux genome卸载,linux学习6

grep表示搜索命令 查找fasta文件中有多少条序列 grep ">" 文件

grep ">" 文件 |

wc 表示找出大于号的行并且输出行即为序列数目

grep -v ">" 文件 表示输出不含大于号的行(加 -v表示反选)

找哪些文件是属于自己用户的文件

ls -l |grep "用户名“

sed 流处理器

sed -e 's/H37Rv_//' H37Rv.fna | grep

">" 表示将H37Rv.fna

的文件删除并且找出含有>的行

sed -e 's/H37Rv_//' H37Rv.fna | le

表示将H37Rv.fna 的文件删除并且显示

sed -e 's/H37Rv_//' H37Rv.fna 只表示对H37Rv.fna

处理不显示

sed -i 's/H37Rv_//' H37Rv.fna 表示在原文件上进行修改(谨慎使用)

1.采用sed命令将fastq数据转化为fasta 格式,命令如下:

sed -e '0~4d' fastq文件 | sed -e ‘0~3d’ | sed -e

‘s/@/>/' 将

fastq文件转化为fasta格式并且输出

sed -e '0~4d' fastq文件 | sed -e ‘0~3d’ | sed -e ‘s/@/>/' >文件名1 将fastq文件转化为文件名1的fasta文件并且保存 查看只需要 less 文件名1即可

2.sed 可以输出一个文件的任一行

sed -n '数字' 文件 可以输出文件的数字表示的行

sed -n ‘数字1,数字2p' 可以输出数字1到数字2之间的行

3.awk亦可以将fastq格式转化为fasta格式,命令如下:

awk '{getline seq;getline plus;getline

qual;sub("@",">",$0);print $0 "\n"seq}' reads.1.fastq

>read.2.awk.fasta

将read.1.fastq转化为read.2.awk.fasta并且保存。

awk可以输出结果的哪一列,格式为:

awk '{print $0}'

blast_m8.out $n n表示数字,表示要输出的列 $0则表示所有的列即一整行。

awk也可以条件输出,如:awk '{if ($3>80 && $4>=100) print

$0}' blast_m8.out | le

表示输出blast_m8的第三列大于80并且第四行大于等于100的结果。

awk '{if ($3>80 && $4>=100)

print $1}' blast_m8.out|sort -n -k2|uniq|wc

输出blast_m8的第三列大于80并且第四行大于等于100的结果并且将其排序(按照第一列的第二项?)并且去重复取唯一的并且统计列数,最终得到了匹配的符合条件的个数。

find在当前目录内查找 grep 表示文件内查找

格式 find 要查找的目录 查找的条件 eg.find

./ -name ‘*.sh'

find ./ amin

5查找最近5min被编辑过的文件

find ./ -size 1500b 找出大于1500b的文件

find ./ 1500b |

xargs rm 管道后加xargs

rm 将查到的文件一次性删除

有好多基因组序列要生成

样品名=每个序列文件的路径 find +awk +sed+ 重定向完成

find .-name *.fna | sed -e

's#\.#/share/genomics/work/0.Shell/genome#1' |awk -F''/'' '{print

$7"="$0}' | sed -e 's/_uid.*=/=/1'

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值