诺禾致源学习笔记

目录

1.linux命令

1.1 linux的权限

linux的权限
权限:

权限 意义 分数权制
w 4
r 2
x 执行 1

eg: 7=4+2+1 #代表w+r+x权限

1.2 帮助文件

man(详细讲解)和–help(使用语法简介)

1.3 目录操作

ls -r 	#反序排列
ls -sh 	# 显示目录文件大小
ls -d a* 	#查看以a开头的目录或文件
cd ~ 	#切换到当前用户目录
cd - 	#切换到上一次进入目录
mkdir 	#创建空目录
mkdir -p 	#创建多级目录
rmdir -p 	#删除空目录
touch 	#创建文件
rm -r 	#删除目录及目录下文件

1.4 文件操作

cp 	#复制文件
cp -r 	#复制目录及目录中的文件
mv 	#移动/重命名 文件/目录:如果输入目录和输出目录一样则是改名字。

1.5 文件编辑

1.5.1 VI编辑器

  • 底行模式
    set nu:列出行号
    / charactor:查找字符
    wq:写入并退出
    q1:强制退出,不会保存修改
cat  	#查看文件内容,一次性输出
cat 1.txt > 2.txt 	#1.txt 文件内容取代2.txt文件
cat 1.txt >> 2.txt 	# 1.txt 文件插入2.txt文件末尾

1.5.2 less/more

less / more  	#分页查看文件内容
less -m  	#显示百分比
less -N  	#显示行号
/charactor  #查看模式下,向下查找字符。向上是 ?character
b  #查看模式下下一页,下半页是d
less -mN

1.5.3 wc/head

head / tail  #查看文件的头部/ 尾部
wc  # 显示文件行数、字数
wc -l <file>	#输出文件行数
wc  -c <file>	#输出文件字节数
wc -w <file>	#输出文件字节数
wc -L <file>	#输出文件最长的一行
ls |wc -l 	#文件下有多少文件和目录

ls |wc -l

1.5.4 grep

grep <str>	#文件查找,并输出匹配行
grep -c <str>	#输出有几行匹配上了
grep -i <str>	#不区分大小写
grep -n <str>	#显示匹配行及其行数
grep -v <str>	#不显示匹配行
grep --color	#检索词加颜色,可以和-i -n 等一起用
grep -n --color "the" 2.txt	#结果如下

cat 2.txt |grep -n --color "the"

grep "t[ea]st" 2.txt	#匹配test 或者tast
grep ^or$	#匹配行首或者行尾
grep [^a]n	#匹配除an外含有n的行
grep ^[TI]  #匹配以T或者I开头的行
grep ^[^a-zA-Z]	#不匹配字母开始的行

在这里插入图片描述

1.5.5 sort

sort -n	#依据数值大小排序
sort -0 <file>	#排序结果存入制定文件
sort -r	#反序排列
sort -k	#以哪个区间排列
sort -c	#检查文件是否按照序列排序
cat file1 file2 | sort | uniq > file3	#两文件并集
cat file1 file2 | sort | uniq -d > file3	#两文件交集
cat file1 file2 | sort | uniq -u > file3	#删除交集,留下各自补集

1.5.6 sed

sed -n	#列出经过sed处理过的一行
sed -e	#直接在命令行模式进行sed动作编辑
sed -i	#直接对原文编辑
sed [参数] 'comand' 输入源文本  
sed -n '1~2 p' a.txt	#a.txt第一行起始,2行为步长输出到屏幕(P)。奇数行。
sed -n '1,+2 p' a.txt	#a.txt第一行起始,起始行后的连续+2行。即前三行。
sed -n '/primary_transcript/,+4 p' genome.gff	#包含 primary_transcript 字符文本的一行及其后4行。
sed '1,3 s/e/E/g' a.txt	#对1-3行进行e到E的替换
sed -e '1~2 d' a.txt	#删除奇数行
sed -e '1,/^chr3/ d' a.txt	#定位:从1行开始到以chr3开头到行。操作:删除
sed '^$ d' a.txt	#定位:空白行。操作:删除
sed '2 a AT3GGO5780	GO:0000167' a.txt	#定位:第二行。操作:在第二行后追加一行。(在第二行之前是i)

1.5.6.1 sed的定位
  • sed 第一行表示:1
  • 最后一行表示:$
  • 正则匹配:/REGEXP/
  • 步长处理:first~step
  • 选择选定行和后面几行:addr,+N
1.5.6.2 sed的正则表达
1.5.6.3 sed的操作命令**
  • a 在当前后添加一行
  • i 在当前行前添加一行
  • d 删除行
  • g 取缓存空间覆盖原有内容
  • p 打印行
  • ! 对选择之外对行执行sed
  • s 字符串替换

1.5.7 cut

cut -c 2-4 2.txt	#2.txt文件每行第2-4共三个字符截取
cut -d '-' -f 2 2.txt	#2.txt文件以“-”为分割制表,每行第二列输出.-d '<charactor>'是指定分割符。默认是tab键

在linux的shell中“tab”键表达方式是control+V+I

1.5.8 文件操作-正则表达

  • 行首定位符:^ls | grep "^Green"grep "^RBM4" 2.txt
  • 行为定位符:$ls | grep "1$"
  • 限定符:
    *:前面字符出现0次或多次。>=0
    +:前面字符出现1次或多次。>=1
    ?:前面字符出现0次或一次。=0 OR =1
  • 字符集:
    [ ]:任意一个字符,数字和字母之间可用-连接表示范围。[abc][0-9][a-z][a-zA-Z]。(a | b | c) = [abc]。
    [^ ]: 字符非匹配。[^abc]不匹配a|b|c任意一个。

正则表达练习网站:https://regexr.com/

━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━━┉┉┉┉∞┉┉┉┉━
●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●∞ ∞●

2. 测序结果的比对定量

2.1 比对原理的介绍

2.1.1 BWT算法学习

需要进一步深入学习

2.1.2 hisat2软件优势

速度比较快,准确率高。

2.2 bowtie2和hisat2的使用

2.2.1索引构建

hisat2-build Escherichia_coli.fa ./Escherichia_coli
#hisat2对大肠杆菌基因组进行索引构建
<
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值