这周我先从网上下载了轨迹数据集到本地,它是来自微软T-Drive项目,包含在2008年北京一万多俩出租车一周的轨迹数据。这个数据集包含了1500万个坐标点,轨迹的总距离达到900多万公里。
然后通过文件流的方式,逐行读入,根据格式将String拆分,将信息提取。
再定义了Point类,方便将数据包装输出。
下周目标:尝试将轨迹数据与Kafka的输入输出结合
周记四
最新推荐文章于 2023-11-11 21:02:12 发布
这周我先从网上下载了轨迹数据集到本地,它是来自微软T-Drive项目,包含在2008年北京一万多俩出租车一周的轨迹数据。这个数据集包含了1500万个坐标点,轨迹的总距离达到900多万公里。
然后通过文件流的方式,逐行读入,根据格式将String拆分,将信息提取。
再定义了Point类,方便将数据包装输出。
下周目标:尝试将轨迹数据与Kafka的输入输出结合