1.grep 查找关键字(可以带通配符) 文件名称
查看某个文件含有某个关键字的行信息
2.查看服务器cpu情况
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
3.查看文件大小
du -sh 文件名
4.查看进程
ps
5.后台挂载
nohup 命令 &
6.解压tar.gz文件
tar -zxvf 压缩文件名.tar.gz
7.压缩成tar.gz文件
tar -zcvf 压缩文件名 .tar.gz 被压缩文件名
8.获取文件的第二列到指定文件
cat test.out | awk '{print $2}' >CDD.txt
9.去除文件相同的行,并放到指定文件里
cat CDD.txt | sort | uniq >CDDuniq.txt
10.截取以begin开头和end结尾的段落(sed)
sed -n '/^begin/,/^end/p' test01.txt
11.看linux版本
uname -a
12.统计文件中相同行的数量
`cat sorttest | sort | uniq -c`
13.linux获得文件相同的行
grep -wf 1.txt 2.txt
14.linux获得文件不同的行,那个文件在前,获得其中的文件
grep -wvf 1.txt 2.txt
15.linux获得多个DNA或RNA序列的长度
awk '/^>/{if (l!="") print l; print; l=0; next}{l+=length($0)}END{print l}' protein-rdrp1.fasta>out.txt
16.linux获得fasta序列中序列的名称和长度、
conda install bioawk
bioawk -c fastx '{ print $name, length($seq) }' < 1.fasta