一、数据预处理必要性
- 改进数据的质量,有助于决策的精度和性能
- 高质量决策依赖高质量的数据,数据预处理是知识发现过程的步骤
二、Tableau的数据预处理
2.1名字的拆分
如图,电影名(中文+时间+英文)很杂乱,我们只需要一个电影名中文
对电影名右键–>拆分,得到新的三个列,把原字段右键隐藏,只保留我们想要的即可。
2.2对累计票房的拆分
电影票房字段真正我们所需要的只是一串数字。
先对累计票房字段进行拆分,再对拆分的新字段改名,往后添加一个单位,只保留只有数据的一列,原数据隐藏
2.3对上映日期进行自定义拆分
右键上映日期,选择自定义拆分。选择使用的字符为(,选择保留的部分为第一个即可。并且,修改后新字段,点击字段的左上角图标更改数据类型为日期。