所用到的数据:
链接:https://pan.baidu.com/s/1iXlMz2YxwfEcehsv8-7Qwg
提取码:5tqn
1、数据前处理
首先导入中国电影网的数据,导入之后就是下图这样:
接下来我们就对上面的数据处理一下:
1.1 数据拆分
发现 “电影名” 这一列是由中文名+年代+英文名组成的,我们右键电影名——>拆分,就会拆分成三个新的列,删除年代和英文名的拆分(右键),并把中文名的拆分修改名称为 “电影名称” (右键) ,再将原始的数据 “电影名” 这一列右键隐藏。
将 “累计票房” 按上面方法同样拆分,并将拆分的数据命名为 “累计票房(万)”,将原始的数据 “累计票房” 这一列右键隐藏。
”导演“、”主演“ 按同样的方法拆分。
对” 上映时间“ 选择自定义拆分,选择”(“ 作为拆分符,如下图,选择保留第一个。重命名为 “上映日期”。
拆分的操作就是这样简单,后面的数据根据需要用到的时候再拆分,这里就先这样了。
1.2 数据转换
如下图所示,将上映日期数据转换成 “日期” 。