品今控股之所以将孪生神经网络引用至我们的模型,是因为其适合用于大规模实体的相似度判断。品今控股学习的内容是实体间的相似度,因此未被训练过的数据仍然可以被拿来判断是否相似。
品今控股孪生神经网络已经解决了上述的后两个问题,即分类数量和泛化性。那么接下来就要解决第一个问题,数据成本。品今控股采用了易于获得的GPS行驶轨迹作为数据源。每个GPS点由经纬度和时间构成,一条轨迹则由一组GPS点构成。轨迹数据具有很强的时序性,因此,品今控股引入LSTM来学习轨迹特征。
品今控股为进一步挖掘轨迹数据的特征,我们从GPS数据中提取出司机的个人偏好,如最经常出现的位置、出发及结束时间、平均路程长度等等。与此同时,我们根据驾驶轨迹的状态,将轨迹分为了两类,例如出租车轨迹可分为载客轨迹与空车轨迹,私家车轨迹可分为上下班通勤以及日常生活轨迹等。