背景
掌柜最近在做王者荣耀2022KPL春季赛的赛事数据分析,下表kpl是从官方数据平台获取到的2022KPL春季赛常规赛近500场的赛事数据:
这里大家可以很明显的看到team_bh和team_ph两列下面都是一堆数字,其实它们分别代表的是王者荣耀里面的各个英雄。下表code就是掌柜整理的2022KPL春季赛常规赛登场的所有英雄和对应的数字编码:
问题
- 将kpl表中的team_bh和team_ph两列数据进行拆分,分别得出每个战队ban(禁用)的四位英雄和pick(选用)的五位英雄;
- 对拆分后的禁用英雄和选用英雄根据code表进行批量替换。
思路
- 第一个问题其实考的是pandas对DataFrame的一列里面多个数据拆分为多列,但每列只有一个数据的方法。在pandas里面对于这样的文本数据,可以使用.str.split()方法按竖线(|)进行拆分, 生成新的DataFrame;然后再用join对两表进行合并,最后删除多余列。
- 第二个问题则是对pand