问题描述
(关于dataframe的append问题,直接拖至文后)
我们有n多单车,每个单车一段时间(差不多一个星期)规律返回的经纬度位置数据,类似于下图,但是有个问题是单车的这些经纬度数据的准确性只有70%左右,不准确的经纬度会出现偏差,我们要做的就是去掉那些噪音比较大的坐标点,筛选出正确位置从而进行之后的操作。
解决方案
- DBSCAN算法简介
- 操作源码
- 小收获&小总结
DBSCAN算法简介
DBSCAN是一种典型的基于密度的聚类算法。
两张图可以非常清晰地表现k-means与DBSCAN的聚类结果:
原始随机数据:
k-means的聚类结果:
DBSCAN的聚类结果:
关于DBSCAN的具体介绍可以参照:
https://blog.csdn.net/jerry81333/article/details/75640140
操作源码
import pandas as pd
from math import radians
from math import tan,atan,acos,sin,cos