项目场景:
提示:这里简述项目相关背景:
例如:项目场景:示例:通过蓝牙芯片(HC-05)与手机 APP 通信,每隔 5s 传输一批传感器数据(不是很大)
数据组装
软件准备:SPAdes
1、选择需要的软件版本,进行安装
conda install -c bioconda spades
(assembly) wangyf@Rs-3:~$ conda search -c bioconda spades=3.12.0
##测试是否安装成功,`spades.py -v` 或者`spades.py -h`,成功界面如下:
(assembly) wangyf@Rs-3:~$ spades.py -v
SPAdes v3.12.0
使用SPAdes组装二代测序数据
(assembly) wangyf@Rs-3:~$ spades.py --meta -t 2 -m 10 \
-1 SRR341593_clean_1.fastq \
-2 SRR341593_clean_2.fastq \
-o /home/xxx/Result
# meta, this flag is required for metagenomic sample data
# m, memeory 250G by default
# t, thread 16 by default
# o, output path
使用QUAST检查组装质量
(assembly) wangyf@Rs-3:~$ quast.py <contigs.fasta> -o <output_dir>
筛选耐药基因
软件准备:args_oap
1、ARGs-OAP:用于筛选环境宏基因组中抗生素抗性基因(ARGs)的特征和定量分析
conda create -n args_oap -c bioconda args_oap
(assembly) wangyf@Rs-3:~$ conda activate args_oap
(assembly) wangyf@Rs-3:~$ args_oap stage_one -i input_dir -o output_dir -f fa -t 8 -m meta_data.txt -n 16
(assembly) wangyf@Rs-3:~$ args_oap stage_two -i output -t 8
#-i input data 一般为fastq格式文件,如果文件问fq.gz格式结尾的压缩文件,
需要先解压(zcat xx_R1.fq.gz > xx_R1.fq)
构建进化树
软件准备:Snippy、gubbins、FastTree
1、Snippy:用于快速单倍体变异调用和核心基因组比对,在基因组样本之间识别单核苷酸多态性(SNP)和小的插入和删除(indel)差异
conda create -n snippy -c bioconda snippy
(assembly) wangyf@Rs-3:~$ conda activate snippy
(assembly) wangyf@Rs-3:~$ /home/wangyf/software/snippy-master/bin/snippy --cpus 16 --outdir mysnps --ref reference.fasta --R1 reads_R1.fastq --R2 reads_R2.fastq
(assembly) wangyf@Rs-3:~$ /home/wangyf/software/snippy-master/bin/snippy-core --noref mysnps
(assembly) wangyf@Rs-3:~$ /home/wangyf/software/snippy-master/bin/snippy-clean_full_aln core.full.aln > clean.full.aln
2、gubbins:用于构建基于点突变的系统发育树
FastTree:用于生成近似最大似然进化树,适用于核苷酸或蛋白质序列的比对
conda install -c bioconda gubbins
conda install -c bioconda fasttree
(assembly) wangyf@Rs-3:~$ run_gubbins.py -p gubbins clean.full.aln
(assembly) wangyf@Rs-3:~$ snp-sites -c gubbins.filtered_polymorphic_sites.fasta > clean.core.aln
(assembly) wangyf@Rs-3:~$ FastTree -gtr -nt clean.core.aln > clean.core.tree