lab1连接服务器
连接服务器
可以使用xshell.exe
也可以使用putty.exe
lab2服务器和本地文件的传输
服务器和本地文件的传输
可以使用filezilla.exe
同样可以使用WinSCP.exe
lab3linux基本命令
ls(查看当前目录文件)
pwd(查看当前路径)
cd (打开文件夹)
cd ../(返回上一层目录)
cd ~(进入个人家目录下)
mkdir(新建文件夹)
rmdir(删除文件夹)
cp -r 文件位置 目的文件位置(复制文件夹)
nano/vi/vim(编辑文本)
more(从开头显示文本的一部分)
cat(显示文本全部内容 -n添加行号)
less(从结尾显示文本一部分)
chmod(修改权限)
wc(统计文件的行数,字数和字符数 -l只看行数)
head -5 a.fa|tail -1(显示第五行)
grep \>(提取带">"的行)
lab4质控fastqcbao
fastqc -t 2 test.fastq -o ./
lab5数据过滤fastx-toolkit
保留quality>20的碱基占总长度90%的reads
fastq_quality_filter -i test.fq -o test_filter.fq -q 20 -v -Q33 -p 90
保留每条序列的第10-30个核苷酸
fastx_trimmer -i test.fq -f 10 -l 30 -o test_trimmer.fq -Q33 -v
将含有adapter的序列且长度低于40bp的序列去除
fastx_clipper -i test.fq -a CTGATAGACTGAT -o test_clipper.fq -Q33 -v -l 40
相同序列合并成单条序列,并对每条序列进行计数
fastx_collapser -i test_1.fq -o test_collapser.fq -Q33 -v
将fastq格式数据转换成fasta格式
fastq_to_fasta -i test.fq -o test.fasta -Q33
将fasta格式数据转换成tabulated格式
fasta_formatter -i test.fasta -o testw0.fasta -w 0#序列不分行
fasta_formatter -i test.fasta -o testw0.fasta -w 7#序列每行7个碱基
fasta_formatter -t -i test.fasta -o testw0.txt#将fasta格式转换成tab格式文件,一列是序列ID,一列是序列
lab6 Tophat+Cufflink
建立索引
bowtie2-build genome.fa genome
将序列比对到基因组
tophat -p 4 -G genes.gtf -o gen_thout genome test.fq
组装表达基因和转录本
cufflinks -p 4 -o gen_clout gen_thout/accepted_hits.bam
echo "./gen_clout/transcripts.gtf">assemblies.txt#>写入>>追加
合并注释
cuffmerge -g genes.gtf -s genome.fa -p 4 assemblies.txt
鉴定表达差异基因和转录本
cuffdiff -o diff_out -b genome.fa -p 4 -L C1,C2 -u merged_asm/merged.gtf gen_thout1/accepted_hits.bam gen_thout2/accepted_hits.bam
使用cummeRbund可视化cuffdiff结果
#下载包
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages