import pandas as pd
import numpy as np
df = pd.DataFrame(index=np.arange(0, 10, 1), columns=[0], data={0: ['S', 'Q', 'Y', 'S', 'S', 'Q', 'Y', 'S', 'Q', 'Y']}) #创建一个表
print(df)
labels = df[0].unique().tolist()
df[0] = df[0].apply(lambda x: labels.index(x)) #用apply对DataFrame里的每一个值进行处理
print(df)
#原本的数据
0
0 S
1 Q
2 Y
3 S
4 S
5 Q
6 Y
7 S
8 Q
9 Y
#处理之后
0
0 0
1 1
2 2
3 0
4 0
5 1
6 2
7 0
8 1
9 2