基因组模拟测序(1):主线的内容
step1:方法
通过 NCBI 的子库 Genome 获得 YJM1386 菌株的基因组测序数据。
使用 art 系列软件中的 art_illumina 程序,对下载基因组序列进行
测序平台为 Hiseq2000 的全基因组测序模拟 5 次,
参数设置见下表。统计模拟结果,计算理论覆盖度(m)、丢失率和覆盖率。
-l | -f | -m | -s | |
---|---|---|---|---|
第一次 | 100 | 2 | 150 | 10 |
第二次 | 100 | 4 | 150 | 10 |
第三次 | 100 | 6 | 150 | 10 |
第四次 | 100 | 8 | 150 | 10 |
第五次 | 100 | 10 | 150 | 10 |
step2:涉及的脚本
#其它参数保持一致,修改 f 值做 5 次测序模拟,f=2,4,6,8,10
art_illumina -ss HS20 -sam -i ./GCA_000977445.2_Sc_YJM1386_v1_genomic.fna -p -l 100
-f 2 -m 150 -s 10 -o ./result/Sc_paired_dat_a
art_illumina -ss HS20 -sam -i ./GCA_000977445.2_Sc_YJM