在数据分析中,基本的是要对数据了解以及熟悉。我们在获取数据之后,要对数据进行一个清洗并加工处理。换言之,就是根据不同的目的采取不同的处理策略。废话不多说,下面直接进入主题。
先假设一个样本数据:
# 假设样本数据
df = spark.createDataFrame([
(1, 136, 178, 28, '武汉', '唱歌'),
在数据分析中,基本的是要对数据了解以及熟悉。我们在获取数据之后,要对数据进行一个清洗并加工处理。换言之,就是根据不同的目的采取不同的处理策略。废话不多说,下面直接进入主题。
先假设一个样本数据:
# 假设样本数据
df = spark.createDataFrame([
(1, 136, 178, 28, '武汉', '唱歌'),