我正试图把一个分类变量变成定量变量。我正在使用
get_dummies
返回量化变量的函数。
我的想法是在数据框中创建新列,并将返回的量化变量添加到这些新列中,但是当我打印出来时,输出将显示其他内容。
我的代码:
import pandas as pd
import numpy as np
df = pd.read_csv('/home/user/Documents/MOOC dataset cleaned/duplicate.csv')
df['0_to_35'],df['35_to_55'],df['greater then 55'] = pd.get_dummies(df['age_band'])
print(df['0_to_35'],df['35_to_55'],df['greater then 55'])
输出:
(0 0-35
1 0-35
2 0-35
3 0-35
4 0-35
5 0-35
6 0-35
7 0-35
8 0-35
9 0-35
10 0-35
11 0-35
12 0-35
13 0-35
14 0-35
15 0-35
16 0-35
17 0-35
18 0-35
19 0-35
20 0-35
21 0-35
22 0-35
23 0-35
24 0-35
25 0-35
26 0-35
27 0-35
28 0-35
29 0-35
...
28755 0-35
28756 0-35
28757 0-35
28758 0-35
28759 0-35
28760 0-35
28761 0-35
28762 0-35
28763 0-35
28764 0-35
28765 0-35
28766 0-35
28767 0-35
28768 0-35
28769 0-35
28770 0-35
28771 0-35
28772 0-35
28773 0-35
28774 0-35
28775 0-35
28776 0-35
28777 0-35
28778 0-35
28779 0-35
28780 0-35
28781 0-35
28782 0-35
28783 0-35
28784 0-35
Name: 0_to_35, dtype: object, 0 35-55
1 35-55
2 35-55
3 35-55
4 35-55
5 35-55
6 35-55 (0 0-35
1 0-35
2 0-35
3 0-35
4 0-35
5 0-35
6 0-35
7 0-35
8 0-35