1、hdbscan
概述:HDBSCAN(Hierarchical Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的层次聚类算法,用于将数据点划分为具有不同密度的聚类。它是对传统的DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法的改进和扩展。
HDBSCAN通过测量数据点之间的密度来确定聚类结构。它将数据点分为核心点、边界点和噪声点。核心点是在给定半径范围内具有足够相邻数据点的点,边界点是邻居内没有足够相邻点的点,而噪声点是在任何邻域内都没有足够相邻点的点。
HDBSCAN的主要优势是它能够处理具有不同密度的聚类,并自动确定聚类的数量。它采用一种层次聚类的方法,通过构建一棵密度聚类树将数据点分层次地组织起来。通过对聚类树进行截断,可以在不同的聚类级别上获得不同的聚类划分结果。
相对于传统的聚类算法,HDBSCAN具有以下优点:
①.自动确定聚类的数量:HDBSCAN可以根据数据的本地密度自适应地确定聚类的数量,而无需事先指定。
②.处理不同密度的聚类:HDBSCAN能够识别和区分具有不同密度的聚类,对于数据集中的离群点和噪声数据具有较好的鲁棒性。
③.层次聚类能力:HDBSCAN通过构建密度聚类树,提供了一种层次化的聚类结果。这使得用户可以根据需求从不同的聚类级别中选择最合适的划分。
需要注意的是,HDBSCAN的计算复杂度相对较高,对于大规模数据集可能需要较长的计算时间。然而,它在许多领域中已经被证明是一种强大而有效的聚类方法,特别适用于复杂数据集、非凸形状的聚类和噪声点的处理。
安装环境:使用conda安装,支持在py3或是py2环境下安装,并且支持目前的最高版本,但最好在3以上版本安装。
安装方法:推荐使用githue上官方(https://github.com/scikit-learn-contrib/hdbscan)安装方法,一次性安装不要自己安装依赖,不建议手动安装(手动一般装不上)。
conda install -c conda-forge hdbscan
2、open3d
概述:Open3D是一个现代化的开源库,用于处理三维数据和构建三维图形应用程序。它提供了一套强大的工具和算法,旨在简化和加速三维数据处理、可视化和机器学习任务。
以下是Open3D库的一些主要特点和功能:
三维数据处理:Open3D支持针对点云、网格、体素等各种形式的三维数据进行处理。它提供了常见的数据操作,例如加载、保存、滤波、采样、配准、分割等,使用户能够方便地操纵和处理三维数据。
可视化:Open3D具有强大的可视化功能,可以将三维数据以交互式的方式可视化。它支持对点云、网格和体素进行渲染,并提供了丰富的视觉效果和交互选项。用户可以自定义颜色、标签、阴影、光照等,以及与可视化对象交互的方式。
三维几何算法:Open3D实现了多种常见的几何算法,例如点云配准、重建、曲面重建、法线估计、刚体变换等。这些算法可以帮助用户在三维数据上进行各种任务,如目标识别、形状分析、场景重建等。
机器学习集成:Open3D提供了与机器学习框架(如PyTorch和TensorFlow)的集成,使用户能够在三维数据上应用深度学习算法。它提供了与这些框架的数据交换接口,并为一些常见的三维问题提供了预训练的模型和示例代码。
多平台支持:Open3D可以在多个平台上运行,包括Windows、Linux和macOS。它提供了Python和C++两种编程接口,用户可以根据自己的需求选择适合的接口。
总之,Open3D是一个功能丰富、易用且高性能的三维数据处理和可视化库。它通过提供一系列工具、算法和接口,简化了三维数据的处理和分析,为用户开发三维图形应用程序提供了便利和效率
安装环境:在conda环境下使用pip安装,python环境版本号不得大于3.9,建议3.8一下版本。
安装方法:pip install open3d
3、conda配置虚拟环境的常用命令
创建虚拟环境
conda create --name **** python=3.8 # 创建指定python版本查看创建的虚拟环境
conda env list
激活/使用/进入某个虚拟环境
conda activate ****查看当前环境安装的库
conda list
退出当前环境
conda deactivate ****
源服务器管理
conda config --show-sources查看当前使用的源服务器
conda config --remove channels 源名称或链接 #删除指定源
conda config --add channels 源名称或链接 #添加指定源#注:“****”表示自己定义的虚拟环境名