1.linux命令
1.1 linux的权限
权限:
权限 | 意义 | 分数权制 |
---|---|---|
w | 写 | 4 |
r | 读 | 2 |
x | 执行 | 1 |
eg: 7=4+2+1 #代表w+r+x权限
1.2 帮助文件
man(详细讲解)和–help(使用语法简介)
1.3 目录操作
ls -r #反序排列
ls -sh # 显示目录文件大小
ls -d a* #查看以a开头的目录或文件
cd ~ #切换到当前用户目录
cd - #切换到上一次进入目录
mkdir #创建空目录
mkdir -p #创建多级目录
rmdir -p #删除空目录
touch #创建文件
rm -r #删除目录及目录下文件
1.4 文件操作
cp #复制文件
cp -r #复制目录及目录中的文件
mv #移动/重命名 文件/目录:如果输入目录和输出目录一样则是改名字。
1.5 文件编辑
1.5.1 VI编辑器
- 底行模式
set nu
:列出行号
/ charactor
:查找字符
wq
:写入并退出
q1
:强制退出,不会保存修改
cat #查看文件内容,一次性输出
cat 1.txt > 2.txt #1.txt 文件内容取代2.txt文件
cat 1.txt >> 2.txt # 1.txt 文件插入2.txt文件末尾
1.5.2 less/more
less / more #分页查看文件内容
less -m #显示百分比
less -N #显示行号
/charactor #查看模式下,向下查找字符。向上是 ?character
b #查看模式下下一页,下半页是d
less -mN
1.5.3 wc/head
head / tail #查看文件的头部/ 尾部
wc # 显示文件行数、字数
wc -l <file> #输出文件行数
wc -c <file> #输出文件字节数
wc -w <file> #输出文件字节数
wc -L <file> #输出文件最长的一行
ls |wc -l #文件下有多少文件和目录
1.5.4 grep
grep <str> #文件查找,并输出匹配行
grep -c <str> #输出有几行匹配上了
grep -i <str> #不区分大小写
grep -n <str> #显示匹配行及其行数
grep -v <str> #不显示匹配行
grep --color #检索词加颜色,可以和-i -n 等一起用
grep -n --color "the" 2.txt #结果如下
grep "t[ea]st" 2.txt #匹配test 或者tast
grep ^or$ #匹配行首或者行尾
grep [^a]n #匹配除an外含有n的行
grep ^[TI] #匹配以T或者I开头的行
grep ^[^a-zA-Z] #不匹配字母开始的行
1.5.5 sort
sort -n #依据数值大小排序
sort -0 <file> #排序结果存入制定文件
sort -r #反序排列
sort -k #以哪个区间排列
sort -c #检查文件是否按照序列排序
cat file1 file2 | sort | uniq > file3 #两文件并集
cat file1 file2 | sort | uniq -d > file3 #两文件交集
cat file1 file2 | sort | uniq -u > file3 #删除交集,留下各自补集
1.5.6 sed
sed -n #列出经过sed处理过的一行
sed -e #直接在命令行模式进行sed动作编辑
sed -i #直接对原文编辑
sed [参数] 'comand' 输入源文本
sed -n '1~2 p' a.txt #a.txt第一行起始,2行为步长输出到屏幕(P)。奇数行。
sed -n '1,+2 p' a.txt #a.txt第一行起始,起始行后的连续+2行。即前三行。
sed -n '/primary_transcript/,+4 p' genome.gff #包含 primary_transcript 字符文本的一行及其后4行。
sed '1,3 s/e/E/g' a.txt #对1-3行进行e到E的替换
sed -e '1~2 d' a.txt #删除奇数行
sed -e '1,/^chr3/ d' a.txt #定位:从1行开始到以chr3开头到行。操作:删除
sed '^$ d' a.txt #定位:空白行。操作:删除
sed '2 a AT3GGO5780 GO:0000167' a.txt #定位:第二行。操作:在第二行后追加一行。(在第二行之前是i)
1.5.6.1 sed的定位
- sed 第一行表示:
1
- 最后一行表示:
$
- 正则匹配:
/REGEXP/
- 步长处理:
first~step
- 选择选定行和后面几行:
addr,+N
1.5.6.2 sed的正则表达
1.5.6.3 sed的操作命令**
- a 在当前后添加一行
- i 在当前行前添加一行
- d 删除行
- g 取缓存空间覆盖原有内容
- p 打印行
- ! 对选择之外对行执行sed
- s 字符串替换
1.5.7 cut
cut -c 2-4 2.txt #2.txt文件每行第2-4共三个字符截取
cut -d '-' -f 2 2.txt #2.txt文件以“-”为分割制表,每行第二列输出.-d '<charactor>'是指定分割符。默认是tab键
在linux的shell中“tab”键表达方式是control+V+I
1.5.8 文件操作-正则表达
- 行首定位符:
^
:ls | grep "^Green"
;grep "^RBM4" 2.txt
- 行为定位符:
$
:ls | grep "1$"
- 限定符:
*
:前面字符出现0次或多次。>=0
+
:前面字符出现1次或多次。>=1
?
:前面字符出现0次或一次。=0 OR =1 - 字符集:
[ ]
:任意一个字符,数字和字母之间可用-
连接表示范围。[abc]
;[0-9]
;[a-z]
;[a-zA-Z]
。(a | b | c) = [abc]。
[^ ]
: 字符非匹配。[^abc]
不匹配a|b|c任意一个。
正则表达练习网站:https://regexr.com/
━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━
●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●
2. 测序结果的比对定量
2.1 比对原理的介绍
2.1.1 BWT算法学习
需要进一步深入学习
2.1.2 hisat2软件优势
速度比较快,准确率高。
2.2 bowtie2和hisat2的使用
2.2.1索引构建
hisat2-build Escherichia_coli.fa ./Escherichia_coli
#hisat2对大肠杆菌基因组进行索引构建
<