目录
一、原始数据质控
采用FastQC对放线菌的碱基质量分布、序列平均质量分布、碱基种类的分布含量、GC含量分布进行分析。
1.Anaconda配置
Anaconda官网 Download (anaconda.com)
- 开源包管理系统和环境管理系统 ,包括多种语言的包安装,运行,更新,删除,最重要的是可以解决包依赖问题
- 支持语言包括 Python,R,Ruby,Lua,Scala,Java,JavaScript,C / C ++,FORTRAN
1.1安装
bash Anaconda3-2023.07-1-Linux-x86_64.sh
1.2环境配置
在bashrc文件当中添加conda的路径
- 首先进入bin目录
cd ~/anaconda3/bin
- 使用nano编辑器修改bashrc文件
nano ~/.bashrc
- 在文件最下方添加环境变量
export PATH="/home/yaoxiaowen/anaconda3/bin:$PATH"
- ctrl+x保存并退出
- 重新激活环境
soucre ~/.bashrc
1.3操作
- 版本检查
conda --version
- 镜像建立
conda config --set show_channel_urls yes
- 环境建立
conda create --name your_envs_name
- 查看所有环境
conda info --envs
- 环境激活
conda activate
2.FastQC配置
2.1安装
- 下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.12.1.zip
- 解压
unzip fastqc_v0.12.1.zip
- 修改权限
chmod 777 ./fastqc
2.2环境配置
nano ~/.bashrc
export PATH="/home/yaoxiaowen/FastQC:$PATH"
soucre ~/.bashrc
-
2.3操作
- 基本格式
fastqc -o out_path sample1_1.fq .. sample1_2.fq
- -o --outdir:输出路径
- --extract:结果文件解压缩
- --noextract:结果文件压缩
- -f --format:输入文件格式.
- -t --threads:线程数
- -c --contaminants:制定污染序列。
- -q --quiet:安静模式