前言
在数据处理中,源数据可能具有一定便于记录但又复杂的结构,我们在后续使用数据时还需要进一步进行处理。在本例中,要根据一列数据提取出数据中的相关特征,我们来看看 pandas 是如何完成的。
需求:
- 以上数据的 a
列是包含复杂信息的字符串类型列。每个值由连字符连接信息,每个信息由数字和字母组成,数字代表此字母的数量,有些行可能包含多个相同字母。 - 现在的需求是在数据后边增加一些列,每个字母为一列,值为本行对应字母的数量。
- 如,索引 0 行,增加 R、A、G 三列,值分别是 13(有两个 R,前边的数字需要相加)、5、4。
二、使用步骤
1.引入库
代码如下(示例):
import pandas