可以进步的改进点总结
case1:进一步改进knn算法:
1.感觉结算fence area的计算好像是有点问题,计算的是包裹住4个点的最大矩形的对角线的距离,而不是订车区域面积,这个需要改进一下。应该是选择其中一个点到其他点距离的中位数两个距离相乘,即矩形的长宽相乘得到面积。
2 里面只是使用了前2w个数据,可以放开全部数据
case2: 使用kmeans算法
使用kmeans去拟合进入订单最大的top20个区域,距离每个中心店距离最近的停车点就选择作为潮汐点
case3:不仅使用订单数据,还要使用轨迹数据进行综合判断:
1 数据需要清洗,有不合理数据
2 “潮汐”的进出判断应该包括在一定范围内的骑行量,在一定时间段内骑行人数多也是潮汐的表现,所以应该增加对于最大数据量(骑行轨迹数据)的判断
3 关于骑行量的判断,就是在top100的潮汐点中选择一定区域范围内,不同骑行id数量最多的top50,最终作为潮汐点。
因为电脑一直在跑 全球人工智能技术创新大赛 热身赛一: 布匹疵点智能识别
暂时还没法跑这个,仅提供自己后续准备改进的方式方法。