基因组注释工具MAKER的报错与解决方法 ● 报错内容:ERROR: Could not determine if DFam is installed● 解决措施:● export LIBDIR=/your_path/envs/maker/share/RepeatMasker/Matrices● export LIBDIR=/your_path/envs/maker/share/RepeatMasker/Libraries● 报错内容:/your_path/maker/bin/perl: symbol lookup error: /you
R数据对象快速保存与读取:qs包 qs是一个R语言包,使用qs可以快速地从磁盘中保存和读取对象。** 它的主要目的是替换R中的saveRDS和readRDS函数,提供了一个更加快速而完整的数据读写方法。** 受到fst的启发,qs通过lz4/zstd库使用了类似的块压缩设计。它的不同之处在于,对属性和对象的引用设计了更普适的方法。一方面,saveRDS和readRDS是R数据序列化的标准,但是这些函数没有针对速度进行优化;另一方面,fst非常快,但只适用于部分数据类型如data.frame。
LD衰减图解读 基于分子标记(例如,SNP芯片,GBS测序)的GWAS分析,其实并没有检测到功能突变,本质就是利用标记和功能突变的相关性(LD关系),来检测与性状相关的功能突变的位置。例如在下图2中,在群体中(A,a,B,b)各个基因型的频率已知的情况下,各种单倍型的期望频率(AB、Ab、aB、ab)都是可以计算出来。例如,AB的频率=(A的频率)X(B的频率)。但我们实际统计群体中各个单倍型的频率的时候,会观察到某些单倍型的频率会大于期望值,例如下图中的单倍型AB的理论频率是0.12,但观察到的实际频率是0.29。
fastq文件Phred33/Phred64质量体系 如果有2个以上的质量字符ASCII值小于等于58(即有两个碱基的得分小于等于25),同时没有任何质量字符的ASCII值大于等于75,即判断是Phred+33。如果有2个以上的质量字符ASCII值大于等于75(即有两个碱基的得分大于等于10),同时没有任何质量字符的ASCII值小于等于58,即判断是Phred+64。= (碱基质量值 + 33)的ASCII值 —> 从第一个可见字符!= (碱基质量值 + 64)的ASCII值 —> 从@字符开始。互相转换脚本,待写。