在人类基因组变异解读领域,不管是肿瘤体细胞变异还是遗传病的胚系变异,如何正确的判定每一个变异的致病还是良性始终是一个核心问题所在。VarJudg就是这样一个提供变异判定的工具。
由于原始变异的数目巨大,有些下机数据超过10万条变异,大部分公司采用的方法就是先进行过滤,(比如去掉无记载的基因间区域变异,去掉同义突变,去掉人群频率高频的变异等等,前面也讲过,这些过滤都有一定概率出错),然后再剩下不到100个变异的情况下,人工+自动对变异进行判别,最后决定哪些变异报哪些变异不报。
为啥一定要用人工,因为目前能找到的变异判定算法都不能达到人工的精度。VarJudg开发的初衷就是为了让软件判定的精度达到或超过人工。
VarJudg的判定思想很简单,把所有已知的数据库整合成一个数据库(含大量手工校准),然后根据ACMG规则(依据实战和自动化需求,对ACMG判定规则进行大幅度的修改、延展和缩减等处理)来进行判定,最终接近人工判定结果,并给出详细的变异判定证据。
VarJudg的开发和修改,历经5年多,训练了肿瘤和全外遗传病数据超过5000份。自认为成为一款工业软件,其逻辑节点超过百万,其核心并不在于代码的高深或什么特殊的判定规则,而是这5年反复训练迭代,从最初版到现在超过1000个补丁,目前已经到5.0版本。
VarJudg说明书在百度网盘上有下载。pan.baidu.com/s/14P6Q8E95656ARHjhRLxsQw 提取码:csj9
VarJudg现在已经整合到ETW软件中,可以方便的进行变异判定并出具自定义的word报告。提供免费试用。
最后提一下,看到很多公司采用非常传统的生信过滤加人工判别出具报告,出现非常多的漏报和错报,只不过自己发现不出来,VarJudg并行跑一下后就能看到很多差距。有需求的可以联系VarJudg开发者。