基于隐马尔科夫链模型的地图匹配问题 map matching based on HMM

qzdc

已于 2023-09-11 14:30:18 修改

阅读量588

点赞数

文章标签： c++ 数据结构算法图搜索算法

于 2023-09-11 14:29:04 首次发布

本文链接：https://blog.csdn.net/m0_62623586/article/details/132806092

版权

完整项目文件见我的仓库

一、数据存储方式

数据点、带时间的数据点：使用struct Posi 、 Posi_t。前者用于road里的数据点，后者用于track里的数据点。
图：使用邻接表，用vector数组实现。定义struct road存储路段id，数据点个数，路段长度，开始的点，结束的点以及道路等级。里面还有一个Posi型vector存储点信息。
轨迹Posi_t的vec组成的vec。
格子：长度、数量均可变，用二维vector实现
当前的概率与最对应的前置状态：用map实现
最短距离：用map<int,double>型的vector，每个map代表始发点，其中第一个int是到达点的id，第二个double是最短路的长度。

二、函数介绍

1. cqlt_pp_eu：输入两个点，返回二者的欧拉距离。定义为内联函数。
2. read（）：先读取道路信息，忽略道路等级的string，顺便得到道路的长度、道路最西、最南的值。由于输入数据把两条相反的路放在相邻位置，如果是二者终点、起点相同，则二者为友路。然后读取轨迹信息。
3. initial（）：根据read得到的经纬度最小值，结合定义的格子大小，计算每条路上每个点应该属于哪个格子，然后把路的id插入格子里，同时插入周围的8个格子中。插入完成后对格子中去除重复边。
4. no_dunjiao：输入三个点，第一个点是轨迹点，另外两个个是路段起始点。返回一个布尔值，判断路段起始点是否是钝角。都不是则返回false。
5. cqlt_s：输入三个点，返回这三个点对应三角形的面积。
6. cqlt_posi_to_edge，输入一个点和一个边，利用刚刚的面积和路段距离计算该点到此边的距离，并判断垂线是否在路段上。返回路段和点的距离。
7. cqlt_start_to_posi：输入一个点和一条边，返回这个点到路段开始点的距离
8. Dijkstra（）：用优先队列优化的版本。对shortestlens经行修改。首先循环始发点，对于每个始发点，创建一个<double,int>型小端优先队列double是首发点到顶点为int值最短路径长度。每次pop一个pair出来，判断是否经过pair对应的顶点会不会更优。当q为空时、最短路径长度已经超过约定值、已经有50条最短路时就结束，将结果加入shortestlens中。最开始是存路径，用一个单独的函数计算距离。但是这样会带来额外的时间开销。所以直接往map里存距离就行，避免重复计算，直接预处理。但是这样就会带来一个问题，就是有可能会访问到不存在的元素，所以需要判断key是否在map里。
9. cqlt_p2p_onroad：输入2点和2点对应的匹配上的边，利用刚刚的Dijkstra算法得到的路径距离，返回二者在地图上的路径长度。
10. guancegailv：输入一点和一边，根据点和边的距离，以及道路等级，由正态分布概率公式得到观测概率：

1. zhuanyigailv：输入两点两边，计算出两点在地图上的距离dis，然后计算出转移概率。其中β是和t有关的超参，随着两点时间差越来越大，β就越来越大：

1. match：输入一条轨迹，一个空的vector存储前向边，和一个空的vector存储最后的概率。根据轨迹得到所在格子，如果是第一个点就只计算观测概率，之后所有的点还要计算状态转移概率。将遍历每个点的所有边，将状态转移概率与所有前向边概率相乘。然后找到乘积最大的一项，得到对应的前向边与概率，乘观测概率，更新，然后开始下一次遍历。这样结束就得到每一点中所有匹配边的前向边以及最终的概率，这两个就是要修改的“返回值”。
2. print：传入前向边矩阵和最终概率矩阵，找到最大概率的一项，在前向边矩阵中向前遍历，直到最开始。然后输出遍历结果。