- 博客(4)
- 收藏
- 关注
原创 期末复习 大数据采集
有一个电影评分数据集IMDB-Movie-Data.csv,里面包含了电影标题、类型、导演、演员、上映年份、电影时长、评分、收入等信息,下面使用pandas、NumPy和Matplotlib对数据集进行分析。要求设计并实现一个分布式实验系统。Telnent数据作为数据源,Flume采集Telnet的数据,并将数据发送到Kafak系统中的test_topic主题中,通过Kafka的consumer查看收到的数据。设计一个能生成20个取值范围为0到100随机整数的转换的作业,要求每隔10秒生成1组。
2023-06-09 10:33:18 901 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人