写在前头:
更多大数据相关精彩内容请进我的知识星球,每周定期更新
正篇
技术路线:实时数据——>kafka——>flink——>mysql
1、 实时数据:
参考链接https://blog.csdn.net/qq_22611181/article/details/119900250,该链接是如何用python写kafka生产者程序。
2、flink:
这里我们直接在本地开发环境Pycharm跑的程序,就不需要安装flink了,感兴趣Linux镜像安装部署flink的可以参考该链接https://blog.csdn.net/qq_22611181/article/details/119812701。
3、模拟数据为客流数据:
客流数据格式为json,其关键key有车站id,车站名,发生时间,设备id,客流量,进站还是出站,具体如下所示
{'stationid':1, 'stationname':'车站1', 'time':'2021-08-01 00:00:00', 'equipmentid':10, 'num':10, 'inorout':0}
pytho