使用Guppy进行basecalling时需要指定与芯片类型匹配的config文件。所有config文件均在Guppy软件的data文件夹下。如果已知所用芯片型号,则直接选择对应的config即可。若不知道(比如第三方测序的或者其他来源的),可以根据下机报告(一个***Run Report***.html文件)中的“Run configuration”部分查看:
可以看到这批数据用的flow cell type是FLO-MIN106,所用的Kit type是SQK-RNA002。接下来需要查看与之对应的config文件,进入Guppy的bin文件夹,运行(不要复制,手动输入):
./guppy_basecaller --print_workflows
可以看到:
FLO-MIN106 SQK-RNA001 rna_r9.4.1_70bps_hac 2020-09-07_rna_r9.4.1_minion_256_8f8fc47b
FLO-MIN106 SQK-RNA002 rna_r9.4.1_70bps_hac 2020-09-07_rna_r9.4.1_minion_256_8f8fc47b
因此,所需的config文件是rna_r9.4.1_70bps_hac。运行Guppy时,-c参数后跟后缀为.cfg的文件:rna_r9.4.1_70bps_hac.cfg(高精度但慢)或rna_r9.4.1_70bps_fast.cfg(快速但精度低)其中一个即可。