2021年广东省大数据技术与应用技能大赛 真题测试数据

本文聚焦于2021年广东省大数据技术与应用技能大赛的任务三——数据清洗与分析,提供了test.txt和demo.txt两个数据集作为实践素材。读者可以通过 Scala 对这些数据进行清洗和分析,提升在数据预处理方面的能力。数据集包含字段如id、时间戳、酒店信息等,适合用于练习日期格式校正、缺失值处理等数据清洗技巧。
摘要由CSDN通过智能技术生成

2021年广东省大数据技术与应用技能大赛 真题测试数据

前面两章讲过关于2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析:

本章主要写的是对于大数据技术与应用这块当中的任务三《数据清洗与分析》,对于前面两章如果有认真看的小伙伴,应该可以大概写出不少的代码了。
但对于数据缺少可能部分小伙伴不知道如何下手,一下提供两种数据,大致涵盖了前面两章任务三所有任务需要用到的字段等,可以试着对下面的两种数据进行清洗和分析,加强自己的能力。

第一个:test.txt

id|name|startTime|endTime|queshi|hotel_name|hotel_province|OTA
1|hh|1998-9-12 12:1:00|2001-9-11||jiudian|gd|2012-8-12
2|aa|1999/9-22|2003-9-11||
  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值