CNV学习6(在 Illumina BeadStudio/GenomeStudio 软件中运行 PennCNV )

本说明描述了在 Illumina BeadStudio/GenomeStudio 软件中运行 PennCNV 以促进 CNV 调用的自动处理和可视化的过程。此过程仅在安装了 ActivePerl 5.8.8和 BeadStudio 3.1的32位 Windows XP 上测试过,或者在安装了 ActivePerl 5.10.1和 GenomeStudio 2009的 Windows XP 上测试过。

注意: 64位 Windows 系统应该与大多数32位可执行程序兼容,只要程序的所有组件都以32位代码编译; 因此,如果你在64位 Windows 计算机上安装32位 Perl,原则上 PenCNV 仍然可以运行而不需要重新编译,这已经得到一些用户的证实。

在 BeadStudio 中使用 PennCNV 之前,用户应该了解其中的一些优点和缺点。优势是显而易见的: 人们可以简单地点击鼠标按钮,执行 CNV 检测和可视化。缺点是: (1)非常慢: CNV 调用是通过从 BeadStudio 一个接一个地导出信号文件,然后对每个文件一遍又一遍地调用 PennCNV,并且每次都将所有必要的模型文件重新加载到内存中来实现的,这是 PennCNV 执行 CNV 分析的一种非常低效的方法。(2)不允许对 CNV 呼叫结果进行灵活的后处理。(3)不允许 PennCNV 以家庭为基础呼叫 PennCNV。一般来说,由于在 BeadStudio/GenomeStudio 中运行 PennCNV 效率低下,如果你有成百上千个样本,而且你只使用 Windows 系统,并且你不想等上好几天才运行 CNV 分析,那么你最好使用 Windows shell 或者 Cygwin 的命令行来运行 PennCNV,同时使用 BeadStudio 插件来验证所选样本中重要的 CNV 调用。我们现在已经提供了辅助程序(visalize _ cnv.pl)来将 PennCNV 输出直接转换为 BeadStudio/GenomeStudio 书签,这样您就可以在命令行中运行 PennCNV,然后直接导入对 Illumina Genome Viewer 的调用进行可视化。

Installation

确保您的计算机至少有2GB (最好是4GB)内存。(如果计算机内存较少,PennCNV 仍然可以在虚拟内存上运行,但速度极其缓慢!)现在下载 PennCNV,解压缩文件,然后将生成的 PennCNV 文件夹移动到 C:\penncnv\ 中。下载用于 Windows 5.8.8版本的 ActivePerl,安装包含所有默认选项的 ActivePerl 程序(默认安装位置是 C:\perl,可执行文件是 C:\perl\bin\perl.exe)。

为了确保 PennCNV 在你的操作系统中正常工作,打开一个命令终端(点击计算机屏幕左下角的任务栏中的“开始”按钮,选择“运行”,然后键入 cmd.exe) ,然后输入 perl C:\penncnv\detect_cnv.pl 来查看程序是否能成功运行(一系列命令行选项将在屏幕上打印出来)。

如果您还没有这样做,请从 http://www.illumina.com/pagesnrn.ilmn?ID=229下载 Illumina 通用 CNV 适配器插件,并在 BeadStudio 中使用 v1,在 GenomeStudio 中使用 v2。使用所有默认选项安装程序(默认安装位置是 C:\Program Files\Illumina\BeadStudio 2.0\CNVAlgorithm\UniversalCNVAdapter for BeadStudio 或 C:\Program Files\Illumina\GenomeStudio\CNVAlgorithm\UniversalCNVAdapter\ for GenomeStudio)。

现在转到安装目录,将 niversalCNVAdapterPlugin.dll.config 文件重命名为 UniversalCNVAdapterPlugin.dll.config.bak,这样我们就可以根据需要恢复到原始设置。下一步将 UniversalCNVAdapterPlugin.dll.config 文件从 C:\penncnv\extra\ 额外复制到这里。此配置文件包含通过 BeadStudio/GenomeStudio 运行 PennCNV 所需的命令行选项。

使用说明

将 PennCNV 与 BeadStudio/GenomeStudio 一起使用的过程在下面以逐步的方式描述。
首先,我们可以尝试打开一个项目文件。例如,我们可以使用与 PennCNV 教程(在此下载https://penncnv.openbioinformatics.org/en/latest/user-guide/download/)中使用的相同的项目文件,该教程包含一个家庭中3个个体(父亲、母亲和自闭症儿童)的基因分型数据。(如果使用 GenomeStudio,会出现一条警告消息,说明该文件在 GenomeStudio 中打开后无法在 BeadStudio 中打开,只需单击“是”即可接受。)单击“分析”菜单,然后单击“ CNV 分析”(见下文)。
在这里插入图片描述
CNV 分析对话框会显示出来,现在从下拉菜单中选择 PennCNV:
在这里插入图片描述现在我们可以根据需要改变一些参数。例如,通过单击 CommandLineParams 文本框,我们可以更改 check _ cnv.pl 程序的路径,或者更改 HMM 和 PFB 文件。注意,所有的参数都用逗号分隔(不是用空格!).
在这里插入图片描述另外,请注意,在窗口中有一个复选框“仅计算选定的样本”。如果用户已经在 BeadStudio/GenomeStudio 的“ Sample Table”中选择了一个或几个样本,那么选中此框将限制分析仅针对选定的样本。如果项目文件包含数百个样本,则此选项对于检查特定样本中的 CNV 非常有用。
在这里插入图片描述
在现代计算机中处理一个样品大约需要3-5分钟。如果一个示例需要大于10分钟的时间,那么很明显有问题: 打开 Windows Task Manager 检查计算机 CPU/内存使用情况,看看这是否是由于内存不足造成的。CNV 呼叫结果将在 CNV 区域显示(见下文)中显示。每个彩色条代表一个 CNV 调用,而颜色表示拷贝数(见图右上角的图例)。如果您喜欢生成的图形,您可以通过鼠标右键单击图例区域,然后选择另存为图像以保存用于 CNV 调用的 TIFF 文件。
在这里插入图片描述当光标位于图中感兴趣区域的顶部时,可以使用鼠标中的滚动按钮(中间按钮)来放大和缩小特定的基因组区域。例如,我们可以放大 chr5中的 CNV,我们可以看到在父亲中有两个相邻的 CNV (一个缺失,一个重复) ,这个缺失是遗传给后代的。
在这里插入图片描述在上面的计算中,我们使用了 CNV 调用的10-SNP 阈值(这意味着输出中只打印包含 > = 10个 SNP 的 CNV 调用)。现在我们可以使用3-SNP 阈值再次尝试这样做。我们可以在 CNV Analysis Name 框中为分析输入一个新名称(例如,3SNP) ,然后单击 CommandLineParams 旁边的文本框,并将-minsnp,10改为-minsnp,3(见下文)。
在这里插入图片描述再次运行程序,我们将在 CNV 区域显示以下输出:
在这里插入图片描述
当使用3-SNP 阈值时,会产生更多的 CNV 调用。

注意,在默认情况下,PennCNV 只处理常染色体。要处理 chrX,需要将-chrX 添加到命令行参数中,并从那里再次运行 PennCNV。

生成的 CNV 调用可以在 Illumina 基因组观察器中沿着染色体进一步可视化。单击 Tools 菜单,然后单击 Show Genome Viewer 以打开 Genome Viewer。如果使用 GenomeStudio,可能会有一个对话框要求首先为特定样本选择 LRR 和 BAF。接下来,单击“查看”菜单,并选择 CNV 分析作为书签(见下文)。在下拉框中,我们可以选择刚才执行的 PennCNV 分析。这可能是一个好主意,增加默认的不透明度水平约80% ,以更容易的视觉识别小 CNV 在基因组查看器。
在这里插入图片描述点击 OK 后,我们可以直观地检查 CNV 调用来消除虚假调用。BeadStudio 中的一个示例如下所示。(然而,下图使用了人类基因组构建35,导致了小的不一致。).确保选中了“即时模式”复选框,或者在选择了要更新的绘图的不同样本之后必须单击“更新绘图”。

在这里插入图片描述下面的例子显示在 GenomeStudio 中:
在这里插入图片描述通过目视检查预测的 CNV 区域内的信号强度模式,我们可以获得对 CNV 呼叫的额外信心,或消除由于随机信号波动引起的假阳性呼叫。

使用 Bookmark Viewer (参见下面) ,我们可以检查 CNV 调用的细节,并将它们导出为文本文件以便进一步处理。

在这里插入图片描述
通过单击 Save Selected Bookmark Analysis 按钮,可以将 CNV 调用保存为 XML 文件以便进一步处理。但是,当您有大量的示例时,直接使用命令行运行 PennCNV 并保存输出文件会更加容易和信息量更大。

在这里插入图片描述PennCNV 程序还生成一些日志文件,其中包含程序运行信息和样本质量日志。默认情况下,LOG 文件将存储在 C:\Documents and Settings\<username>\Local Settings\Application Data\Illumina\UniversalCNVAdapter for Windows XP,或者C:\Users\<username>\AppData\Local\Illumina\UniversalCNVAdapterfor Windows 7.当出现错误时,最好检查日志文件。检查日志文件将有助于识别问题。在其他一些情况下,样本会产生非常大量的 CNV 调用,因此检查样本质量摘要将有助于识别不适合 CNV 调用的低质量样本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值