【车辆轨迹处理】python实现轨迹点的聚类(一)——DBSCAN算法


前言

  空间聚类是基于一定的相似性度量对空间大数据集进行分组的过程。空间聚类分析是一种无监督形式的机器学习。通过空间聚类可以从空间数据集中发现隐含的信息。
  作者在科研工作中,需要对某些车辆的轨迹数据进行一些空间聚类分析,以期望发现车辆在行驶过程中发生轨迹点”聚集“的行为。当等时间间隔的轨迹点在某片区域分布过于”密“时,我们往往可以在这片区域发现某些信息,例如车辆在这片区域发生驻留或者低速行驶等。
  在空间聚类算法中,DBSCAN是一种简单且有效的聚类算法,它有着基于密度不需要预先指定聚类数计算效率高的优点。
  本文以如下格式车辆轨迹数据为例,实提供了DBSCAN对车辆轨迹数据聚类并分析的方法:

collect_time id lon lat
时间 车辆标识 经度 纬度

  为了尽量去除噪声影响,车辆轨迹数据已经经过滤波平滑,平滑方法可见作者之前文章:https://blog.csdn.net/jgsecurity/article/details/140608431

一、单辆车轨迹的聚类与分析

  对单辆车的轨迹数据,采用DBSCAN算法进行空间聚类。DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种经典的密度聚类算法,适用于发现任意形状的聚类簇。其原理本文不做阐述,如有需要,可以自行搜索。

1.引入库

  使用了数学计算库numpypandas,机器学习库scikit-learn,地理相关库shapelygeopy,绘图库matplotlib

import numpy as np
import pandas as pd
from sklearn.cluster import DBSCAN
from sklearn import metrics
from shapely.geometry import MultiPoint
from geopy.distance import great_circle
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors

2.聚类

  在进行聚类之前,先使用shapelygeopy库实现了get_centermost_point函数。其输入数据cluster是列表类型,表示每一组聚类的点集。作用是在获得了每个聚类之后,计算出该聚类的中心点。

# 计算每个聚类的中心点
def get_centermost_point(cluster):
    # 计算整个点集合的质心点
    centroid = (MultiPoint(cluster).centroid.x, MultiPoint(cluster).centroid.y)
    # 取点集合中离质心点最近的点为中心点
    centermost_point = min(cluster, key=lambda point: great_circle(point, centroid).m)
    # 返回中心点
    return tuple(centermost_point)

  对单辆车的聚类函数cluster_traj,其输入数据data是dataframe类型,表示一辆车的轨迹数据。


# DBSCAN聚类
def cluster_traj(data):
    # 提取dataframe中的经纬度列
    coords = data[['smoothed_lat', 'smoothed_lon']]
DBSCAN种基于密度的聚类算法,可以用于对轨迹数据进行聚类分析。在Matlab中,可以使用改进的Hausdorff距离的DBSCAN算法来进行轨迹聚类。该算法的具体实现包括以下步骤: 1. AIS数据的预处理:对原始的AIS数据进行清洗和处理,以便后续的轨迹分割和聚类分析。 2. 船舶轨迹分割:将预处理后的AIS数据按照定的规则进行轨迹分割,将连续的位置组成个个轨迹。 3. 船舶轨迹相似度度量:使用改进的Hausdorff距离来度量不同轨迹之间的相似度。Hausdorff距离是种用于度量两个集合之间的相似度的距离度量方法。 4. 船舶轨迹聚类:基于改进的DBSCAN算法,对相似度度量后的轨迹进行聚类分析。DBSCAN算法通过定义邻域半径和最小密度来确定核心对象和噪声,并将核心对象连接起来形成聚类簇。 5. 船舶典型轨迹的提取:根据聚类结果,提取每个聚类簇中的典型轨迹,以代表该簇的特征。 以上是DBSCAN轨迹聚类的主要步骤。在Matlab中,你可以使用提供的代码来实现这些功能,并根据具体的数据和需求进行相应的调整和优化。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *2* *3* [【Matlab】基于改进的 Hausdorf 距离的DBSCAN船舶航迹聚类](https://blog.csdn.net/u013367499/article/details/130518216)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值