出租车轨迹 由轨迹点序列组成<x,y,t>附带额外信息 speed,angle(GPS正北为0°,顺时针夹角,极坐标角度方向相反!)
如何匹配轨迹?
轨迹的匹配依赖于单点匹配,在单点匹配的基础上,涉及到两个点之间寻找合理轨迹(路径规划),错误GPS点剔除(模式分类),多点之间的相互验证(投票)。
单点匹配
单点匹配方式:
由目前已知参数,忽略X,Y方向影响是独立同分布,即假设X,Y影响因素相同,因此,<distance,speed,angle>构成判别分析的依据。先假设distance,speed,angle相互独立。
- 距离因素:
假设GPS精度为precession=50m,且GPS满足正态分布, 因此可以假设为µ=0,σ=precession/3(根据6-Σ准则,99.7%的点落在(-3σ,+3σ)中)。那么distance的得分=2*落在(distance,+∞)的概率=1-2*Probility[0,distanc).
- 速度因素:
speed 在单点匹配中,可以忽略。基本上= similarity(speed,实时道路速度)。在实际计算中,这里可能出现一个循环引用问题,因为实时路况本身就是通过计算车辆轨迹匹配的来得到的。在实际计算过程中,需要不是使用速度,而是通过离散化拥堵等级来计算,因此
speed项得分=similarity(拥堵等级,实时路况拥堵等级)=2*(拥堵等级*实时路况拥堵等级)/( 拥堵等级^2+拥堵等级^2)
- 角度因素:
一个直观的方式通过计算车辆行驶角度与道路自身方向的余弦来计算(即可通过向量点积来计算)
但需要考虑速度对角度的影响(因此,这两个因数并不独立)
角度得分= similarity(angle,道路方向)=[cos(angle),sin(angle)][cos(道路方向),sin(道路方向)]
- 综合考虑
实际综合得分total = Σ ω(i)*Score(i)
Σω(i)=1.如果确定ω(i)应该通过机器学习的方式来确定。
最后,使用是还应该加一个因数,先验概率,即某个道路车辆行驶的概率,可以通过现有数据按照前面方法匹配后,进行累计统计得到。
总结
现有问题:ω(i)是经验值,即没有通过一定反馈机制(如反向传播算法BP),没有带标注的测试样例数据是个大问题!