宏基因组分析(一)

目录

一、原始数据质控

1.Anaconda配置

1.1安装

1.2环境配置

1.3操作

2.FastQC配置

2.1安装

2.2环境配置

2.3操作


一、原始数据质控

采用FastQC对放线菌的碱基质量分布、序列平均质量分布、碱基种类的分布含量、GC含量分布进行分析。

1.Anaconda配置

Anaconda官网 Download (anaconda.com)

  • 开源包管理系统和环境管理系统 ,包括多种语言的包安装,运行,更新,删除,最重要的是可以解决包依赖问题
  • 支持语言包括 Python,R,Ruby,Lua,Scala,Java,JavaScript,C / C ++,FORTRAN

1.1安装

bash Anaconda3-2023.07-1-Linux-x86_64.sh

1.2环境配置

在bashrc文件当中添加conda的路径

  • 首先进入bin目录
cd ~/anaconda3/bin
  •  使用nano编辑器修改bashrc文件
nano ~/.bashrc

  • 在文件最下方添加环境变量
export PATH="/home/yaoxiaowen/anaconda3/bin:$PATH"
  • ctrl+x保存并退出
  • 重新激活环境
soucre ~/.bashrc

1.3操作

  • 版本检查
conda --version
  • 镜像建立
conda config --set show_channel_urls yes
  • 环境建立
conda create --name  your_envs_name
  • 查看所有环境
conda info --envs
  • 环境激活
conda activate

2.FastQC配置

2.1安装
  • 下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.12.1.zip
  • 解压
unzip fastqc_v0.12.1.zip
  • 修改权限
chmod 777 ./fastqc
2.2环境配置
nano ~/.bashrc
export PATH="/home/yaoxiaowen/FastQC:$PATH"
soucre ~/.bashrc
  • 2.3操作
  •  基本格式
fastqc -o out_path sample1_1.fq .. sample1_2.fq
  • -o --outdir:输出路径
  • --extract:结果文件解压缩
  • --noextract:结果文件压缩
  • -f --format:输入文件格式.
  • -t --threads:线程数
  • -c --contaminants:制定污染序列。
  • -q --quiet:安静模式
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值