01 前情提要
近期有个小伙伴问我一个问题,有一张数据表,想对其中一列的某些字段进行替换,有没有什么办法。
我一想,这不就是数据清洗的东西吗,正好最近小白也在学,就答应帮他试试,下面我们一起来看下我的成果吧。
首先看下数据,一个简单的场景,有若干衣服的型号,比如女装L码,女装M码,男士XL码,男士XXL码,儿童80,儿童100等尺码,现在需要把尺码去掉,只展示衣服是男装还是女装或者童装。
先说下思路,通过观察这份数据可以发现数据都是女装加尺码、男士加尺码或者童加尺码格式。
所以我的思路是对这一列进行拆分,把衣服的品类和尺码分开,这样就可以得到衣服的品类了,下面来具体操作一下。
02 操作演示
首先,点击替换值,在“女装”后面加一个中横线“-”作为分隔符,之后来看一下,之前的“女装XL”变成了“女装-XL”