1.Lei H , Yang Y . CDAE: A Cascade of Denoising Autoencoders for Noise Reduction in the Clustering of Single-Particle Cryo-EM Images[J]. Frontiers in Genetics, 2021
本文设计了一个级联型降噪自编码器(CDAE),三个模块级联,每个模块包含一个卷积自编码器,由不同SNR的模拟数据进行预训练,并由目标数据集进行微调。
使用了PSNR(peak signal-to-noise ratio)来评价降噪效果,计算公式如下:
其中𝑀𝐴𝑋𝐼2其中为图片可能的最大像素值,例如255(8bit)。
数据集(PDB IDs):5wth, 5k0y, 5flc, and 5gjq;
4个结构,每个结构4种角度,每个角度1000张图像。
2.G. Ji, Y. Yang and H. Shen, "IterVM: An Iterative Model for Single-Particle Cryo-EM Image Clustering Based on Variational Autoencoder and Multi-Reference Alignment," IEEE International Conference on Bioinformatics and Biomedicine (BIBM)
本文设计了一个迭代型降噪自编码器(IterVM),在每次迭代中,它使用无监督的生成模型(即变分自动编码器(VAE))来学习图像中包含的潜在信息。 训练模型后,它会从训练数据中获取解码图像,然后使用基于k-means的算法进行聚类和对齐。
使用FMI指数为聚类评价标准:
数据集(PDB IDs):5flc, 5gjq and 5k0y;
3个结构,每个结构3种角度,每个角度900张图像
3.Sorzano C , Bilbao-Castro J R , Shkolnisky Y , et al. A clustering approach to multireference alignment of single-particle projections in electron microscopy[J]. Journal of Structural Biology, 2010
本文提出了经典的cl2d聚类算法,在xmipp包中可以找到
使用类内角度差Angular distance即同一cluster中样本投影角度差距来评价聚类效果,越小聚类效果越好,一般给出样本类角度差的概率分布,如下所示:
评价数据集使用PDB编号为1BRD的颗粒,生成10000个随机投影角度的投影,分别添加SNR=1/3和SNR=1/30的噪声。
本文也分析了聚类算法的平均图和三维重构结果,用来证明该算法的优越性。
如下类平均图,使用ml2d算法得到一个类,用cl2d(目标算法)可以分成4类:
如下所示,使用真实电镜结果重构,用cl2d分类后得到的颗粒的重构结果(a->b、c)和用全部颗粒得到的重构结果是相似的
3.Reboul C F , Bonnet F , Elmlund D , et al. A Stochastic Hill Climbing Approach for Simultaneous 2D Alignment and Clustering of Cryogenic Electron Microscopy Images[J]. Structure, 2016.
第三篇文章,也是主要分析了平均图和三维重构结果(这里增加了对使用类平均图得到三维重构结果的分析)
A为数据集;B为目标方法得到的聚类类内平均图;C为k-means得到的聚类类内平均图。可见C出现了类规模失衡(类崩塌,group collapse)现象
下图分析了三维重构的表现,注意F对比了用该算法类平均图得到的三维结构的表现效果
(A) 三个使用SHC类平均图得到的三维结构
(B) 在基于SHC算法的迭代聚类和对齐过程中,两个IP3R类平均图的演变
(C) IP3R使用SHC类平均图得到的三维结构.
(D) Plasmodium falciparum 80S ribosome使用SHC类平均图得到的三维结构
(E)真实投影与类平均图的对比
(F) TRPV1 使用类平均图重构得到的三维结构与真实结构低通滤波器滤波(15埃)对比
(G)真实投影与类平均图的对比
总结一下,要评价电镜颗粒图像聚类效果,可以用生成数据集计算聚类accuracy、FMI、Angular distance 等等(评价其他领域聚类效果的指标也可以用),当然,作为结构生物学家往往更注重对解得的结构的影响,因此也可以对比分析聚类后挑选的颗粒(或者直接用类平均图)得到的三维结构