在开始使用OAC分析平台探索数据之前,还须先完成数据准备,这是必不可少的第一步。这部分将带大家了解一下数据准备的内容。
数据准备是获取原始数据并准备好在分析平台中摄取的过程。为了完成最后的准备阶段,必须对数据进行清理、格式化并转换为分析工具可消化的内容。这些都是粗略的,实际过程可以包括范围广泛的步骤,例如合并/分离字段和列、更改格式、删除不必要的或垃圾数据以及对数据进行更正。
使用数据集编辑器可以创建或编辑包含表、联接和扩充数据的数据集。
删除不必要的数据
在处理不同的数据集时,在不同的源中使用额外或不必要的字段是很常见的。要将不同的数据集干净地整合到一个可行的分析平台中,字段必须匹配,这意味着要进行精简和对齐,以便同步。可以使用编辑列的方式,利用函数处理数据。
合并/分离字段
如果您有来自多个不同外部来源的数据,则它们可能使用不同的格式来编写地理位置。例如,一个来源可能有一个街道地址,在一个字段中同时包含数字和名称,而另一个来源可能会将两者分开。正确的分析需要跨字段的一致性,因此需要根据偏好合并或分离地址数据。可以采用拆分/连接的方式处理。
转换数据
让我们以物联网 (