采用dbscan方法对数据集中的上网时长进行聚类分析_细胞内功能单元的空间分布统计方法...

生物成像技术是生物结构和功能研究最直接、最有效的方法,研究者们都希望能通过一张直观、清晰的静态或者动态图像,来分析生物体内超微结构的形态特征、定位分布以及相互作用。荧光成像技术作为其中一种必不可少的分析手段,已广泛用于活细胞成像。通过荧光显微镜,尤其是近几年发展的超分辨荧光显微镜,我们可以更清晰地拍摄细胞内部的精细结构,捕捉快速动态事件,从而反映更加真实的细胞内部生命活动状态。但如果想洞察这些事件背后更深层次的生命活动规律,还需要对荧光成像数据进行深度挖掘,通过图像处理和定量分析计算等方法统计得到肉眼难以直观察觉的规律,以解决生物学研究中的重要基础性、关键性问题。

中国科学院自动化研究所的杨戈教授团队于2018年6月在《Cell Reports》上发表题为“Whole-cell scale dynamic organization of lysosomesrevealed by spatial statistical analysis[1]”的文章,文中通过一系列统计分析方法揭示了溶酶体在整个细胞尺度上的空间分布和动态组织规律,为细胞中溶酶体相关的生命活动的机制研究提供重要工具和线索。本文以此为主要参考资料,向大家介绍一些常用的空间统计分析方法。

前言

真核细胞中含有多种不同的细胞器,这些细胞器相互独立又彼此依存,各个细胞器协同作用,共同完成细胞中复杂的新陈代谢活动。研究表明,不同的细胞器通过膜接触[2]和膜融合[3]等机制直接广泛地相互作用,因此这种相互作用关系严重依赖于各个细胞器的空间分布。

为了研究这一问题,文中特别关注并探讨了细胞中溶酶体的空间分布。我们知道,溶酶体内含多种酸性水解酶,在细胞中主要起到降解的作用,因此广泛分布于细胞当中。在本研究中,作者利用空间统计分析技术,研究溶酶体的集体行为。具体来说,是将溶酶体在单个细胞中的空间分布作为一个空间点过程进行数学处理,并使用相关统计技术进行分析[4-6],从而为其在全细胞范围内空间组织的特定模式、分子机制和细胞功能提供见解。

一、溶酶体空间分布的随机性分析

当我们判断某个要素在空间上是否离散、聚集,或者是随机分布时,就需要考虑要素的空间相关关系。离散是指观测的每个个体之间的差异程度,离散程度越大,差异性就越大。聚集与离散恰好相反,表示个体在一定区域内的相关程度,聚集程度越大,相关性就越好。而随机是指一种完全无规律的分布模式。

为了研究溶酶体是否存在空间组织规律,文章首先对BS-C-1活细胞中溶酶体在整个细胞尺度的空间分布进行统计分析,排除随机性。通过Alexa Fluor 488标记溶酶体,并以每秒4帧的速度拍摄动态图像,持续1分钟(图1A-1B)。由于单个BS-C-1细胞中的溶酶体大多位于同一焦平面,因此将其空间分布简化为二维模型进行。

我们利用单分子检测技术分别对胞内单个溶酶体进行追踪定位,并通过完全空间随机性(CSR)测试检测在不同时间点的溶酶体是否随机分布。具体方法是通过探测到的细胞边界和实际点位置坐标计算细胞内溶酶体的分布函数——Ripley K函数(黑色实线),同时模拟计算同一细胞边界内呈完全随机的泊松分布的Ripley K函数(红色虚线),黑色实线与随机分布的不确定包络线(灰色区域)之间的分离程度表示溶酶体的空间分布与随机分布的相似性。如果实际分布曲线掉落在灰色区域内,则分布是随机的。如图1C-1E所示,在不同时间点,单个细胞内溶酶体的分布离灰色区域很远,说明它的分布是完全不随机的。且在分析的所有时间点上,溶酶体的空间分布都与随机分布有很大不同,这表明溶酶体在整个细胞尺度上有一定的空间组织规律。

7a7226de9dea0be3e656dca67eba8d93.png

图1. 溶酶体在单个细胞中保持着非随机的空间分布

(A)BS-C-1细胞在选定的三个时间点的溶酶体分布。N—细胞核,标尺10μm。

(B)溶酶体运动的最大强度投影(MIP, Maximum Intensity Projection)图像,拍摄速度4帧每秒, 拍摄时长1分钟,每条轨迹对应单个溶酶体的轨迹。主图标尺10μm,小图标尺5μm。

(C-E)(A)中三个时间点溶酶体分布的完全空间随机性(CSR)检验。(C)0s; (D)30s; (E)60s。细胞内溶酶体的adjusted Ripley K函数(黑色实线),同一细胞边界内随机分布的adjusted Ripley K函数(红色虚线),随机分布的不确定包络线(灰色区域)。黑色实线与CSR包络线的分离程度表明溶酶体的空间分布与随机分布有多接近。

二、溶酶体的空间分布规律

上述统计结果显示,溶酶体的空间分布不是随机的,而是存在某种规律。为进一步定量表征其在全细胞尺度上的空间分布,文中采用每隔5秒钟拍摄一幅图像进行了持续1分钟的拍摄,对拍摄结果通过三种距离统计方法计算溶酶体随时间的变化规律(图2)。

第一种方法,利用归一化的细胞器间距离分布(normalized inner-organelle distance)[5]量化溶酶体相对于彼此的定位(图2A)。即任意取细胞中的一对溶酶体,把这些溶酶体对之间的距离进行统计,得到距离分布函数。由于不同细胞的大小不同,需要对距离值做归一化,使得不同大小的细胞具有可比性。对于图1A和1B所示的细胞,这种分布在成像过程中总体保持稳定,并且由概率密度曲线可知,溶酶体对之间距离分布较宽(图2D)。对于不同细胞,溶酶体间距离分布也表现出类似的稳定性,但轮廓线各不相同(图2G,2J)。

第二种方法,利用溶酶体到细胞核的归一化距离分布(normalized to-nucleus distance)量化所有溶酶体相对于细胞核的定位(图2B)。即根据每个溶酶体到细胞核的距离值,计算距离分布函数。如图可知,采用这种方法统计得到的距离分布函数也基本保持稳定,其轮廓线呈现出两个特征峰(图2E)。同样,其他细胞的分布也表现出类似的稳定性,但不同细胞差异显著(图2H,2K)。

第三种方法,利用溶酶体的最近邻距离分布(nearest neighbor distance)量化细胞内溶酶体的拥挤程度(图2C)。即统计每个溶酶体到离它最近的溶酶体间距离,计算距离分布函数。对于图1A和1B所示的细胞,这种分布也保持稳定,并在1μm处出现特征峰值(图2F)。其他细胞的分布也表现出相似的稳定性和轮廓(图2I, 2L)。

综上所述,这三种距离分布共同提供了整个细胞尺度上溶酶体空间分布的综合特征。

a208dc8e2f8fd60432597d19b3a3126f.png

图2. 三种距离统计方法和距离分布曲线

(A) 溶酶体间距离 (B)溶酶体到细胞核的距离 (C)溶酶体的最近邻距离

(D-F)图1(A)和1(B)所示细胞中溶酶体的三种距离分布曲线,按拍摄时间进行颜色编码,每隔5秒绘制一次,共60秒。pdf (probability density function):概率密度函数。

(G-L)其他两个BS-C-1细胞中溶酶体的三种距离分布曲线,G-I:细胞1;J-L:细胞2。

三、单个细胞中溶酶体的分类

由上述统计分析可知,细胞中溶酶体的整体分布是稳定的,但显然单个溶酶体之间的运动各不相同。接下来,文中检测了COS-7细胞中溶酶体群体的组成并根据运动方式进行分类,以探究不同行为的溶酶体如何共同维持整个溶酶体群体的稳定分布。

分类的具体方法是将单个溶酶体作为单颗粒进行跟踪,并通过计算均方位移(Mean Square Displacement,MSD)曲线分析颗粒行为(图3B和3C)[7-8]。如果得到的颗粒MSD曲线关于时间是线性变化的,则该溶酶体的运动是自由扩散的布朗运动;如果MSD曲线向下弯曲,则该溶酶体的运动是受约束的;如果MSD曲线向上弯曲,则除了随机运动之外,该溶酶体还受到了外部的推动力,通常是动力蛋白的牵引作用。因此,单个溶酶体在细胞中的运动可分为三类:1)自由扩散,2)受约束运动,3)有特定方向的运动。

通过MSD曲线分析,49%的溶酶体在细胞中进行受约束运动,31%的溶酶体受到动力蛋白推动在进行定向运动,另外20%的溶酶体在进行自由扩散(图3C)。因此,大多数溶酶体在细胞中进行着受约束运动或定向运动,只有很小一部分经历着自由扩散,这与以往研究中发现的细胞内自由扩散受限理论保持一致[9-10]

7e558621a070b00a5c6cfbb682e9da96.png

图3. 溶酶体种群组成

(A)COS-7细胞中溶酶体运动的最大强度投影图像,拍摄速度10帧每秒,拍摄时长20秒,标尺15μm。

(B)在所有溶酶体轨迹中随机选取10%的MSD曲线。

(C)每种类别溶酶体的百分比。

四、溶酶体的空间聚类分析

在分析了细胞内溶酶体的群体组成之后,文中继续探究它们的空间分布特征。有研究表明,在大多数情况下,正常细胞中的溶酶体会有一部分在细胞核周围聚集[11-12],即核周的溶酶体空间密度明显高于邻近区域。这就提出了溶酶体是否在细胞内某些特定区域聚集的问题。为了回答这个问题,研究者绘制了它们在整个细胞内的空间密度图,通过空间密度的增高可以直观识别溶酶体在细胞内形成的团簇结构(图4A和4B)。接下来,通过计算的方法识别这些聚集区域,文中采用了一种DBSCAN (Density-Based Spatial Clustering ofApplications with Noise)算法,这是一种典型的基于密度的空间聚类算法[13]。该算法将具有足够密度的区域划分为簇,并可以在具有噪声的空间中发现任意形状的簇,将簇定义为密度相连的点的最大集合。DBSCAN算法的显著优点是聚类速度快,不需要事先知道团簇数量,且能够有效处理噪声点和发现任意形状的空间聚类。

通过计算,我们发现细胞中溶酶体的聚集区域不断变化,并且具有合并、分裂、出现和消失等活动(图4C)。研究者通过对聚集区域的提取,能够进行更加深入的细胞内生理功能研究。

a5b7adddf3080fbbce8e4c8676599242.png

图4. 溶酶体在细胞内形成动态团簇

(A)COS-7细胞中溶酶体运动分别在0s,155s,160s,165s时的图像,标尺20μm。

(B)图A中细胞内溶酶体的彩色空间密度图,标尺20μm。

(C)用DBSCAN算法计算得到的溶酶体团簇,三角指向分裂位置,箭头指向融合位置。

结论

综上所述,文中通过统计分析的方法揭示了溶酶体在单个细胞中保持的非随机、稳定而又特异的空间分布,这为细胞内各个功能单元的定位与分布研究提供了必要的分析手段。同时,各种建模仿真与计算分析方法已用于细胞生命过程的研究,计算与生物的交叉势必会带来奇妙的反应,从而推动生命科学领域进入一个全新的境界。

致谢

特别感谢生物成像中心李栋研究员、孙飞研究员以及李硕果工程师在本文撰写过程中给予的指导与帮助。

参考文献

[1] Qinle Ba, Guruprasad Raghavan, Kirill Kiselyov and Ge Yang. Whole-CellScale Dynamic Organization of Lysosomes Revealed by Spatial StatisticalAnalysis [J]. Cell Reports, 2018, 23(12): 3591-3606.

[2] William A. Prinz. Bridging the gap: membrane contact sites in signaling,metabolism, and organelle dynamics [J]. Journal of Cell Biology, 2014, 205(6):759-769.

[3] Sascha Martens and Harvey T. McMahon. Mechanisms of membrane fusion:disparate players and common principles [J]. Nature Reviews Molecular CellBiology, 2018, 9: 543–556.

[4] Adrian Baddeley, Ege Rubak and Rolf Turner. Spatial Point Patterns:Methodology and Applications with R [M]. Chapman and Hall/CRC: 2016.

[5] Peter J. Diggle. Statistical Analysis of Spatial and SpatiotemporalPoint Patterns [M]. Third Edition, Chapman and Hall/CRC: 2014.

[6] Janine Illian, Antii Penttinen, Helga Stoyan and Dietrich Stoyan.Statistical Analysis and Modeling of Spatial Point Patterns [M]. Wiley: 2008.

[7] Hong Qian, Michael P. Sheetz and Elliot L. Elson. Single particletracking. Analysis of diffusion and flow in two-dimensional systems [J]. BiophysicalJournal, 1991, 60(4): 910–921.

[8] Michael J. Saxton. Single-particle tracking: the distribution ofdiffusion coefficients [J]. Biophysical Journal, 1997, 72(4): 1744–1753.

[9] Debjyoti Bandyopadhyay, Austin Cyphersmith, Jairo A. Zapata, Y. JosephKim and Christine K. Payne. Lysosome transport as a function of lysosomediameter [J]. PloS One, 2014, 9: e86847.

[10] Luby-Phelps K., Lanni F. and Taylor D.L. The submicroscopic propertiesof cytoplasm as a determinant of cellular function [J]. Annual Review ofBiophysics and Biophysical Chemistry, 1988, 17: 369–396.

[11] Marlieke L. M. Jongsma, Ilana Berlin, Ruud H. M. Wijdeven, Lennert Janssen,George M. C. Janssen, Malgorzata A. Garstka, Hans Janssen, Mark Mensink, PeterA. van Veelen, Robbert M. Spaapen and Jacques Neefjes. An ER-associated pathwaydefines endosomal architecture for controlled cargo transport [J]. Cell, 2016,166(1): 152–166.

[12] Viktor I. Korolchuk, Shinji Saiki, Maike Lichtenberg, Farah H.Siddiqi, Esteban A. Roberts, Sara Imarisio, Luca Jahreiss, Sovan Sarkar, MarieFutter, Fiona M. Menzies, Cahir J. O’Kane, Vojo Deretic and David C.Rubinsztein. Lysosomal positioning coordinates cellular nutrient responses [J].Nature Cell Biology, 2011, 13: 453–460.

[13] Martin Ester, Hans-Peter Kriegel, Jorg Sander and Xiaowei Xu. Adensity-based algorithm for discovering clusters in large spatial databaseswith noise [C]. Proceedings of the 2nd International Conference on KnowledgeDiscovery and Data Mining, AAAI Press, 1996. 226–231.

======作者小档案======

9cf953bf4e1c6b4aab1477a9918395e7.png

冯韵博士,2017年毕业于北京理工大学光电学院,同年加入中国科学院生物物理研究所生物成像中心任职图像数据处理工程师,研究方向为荧光图像处理与数据分析。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值