data = [['青年', '否', '否', '一般', '否']
, ['青年', '否', '否', '好', '否']
, ['青年', '是', '否', '好', '是']
, ['青年', '是', '是', '一般', '是']
, ['青年', '否', '否', '一般', '否']
, ['中年', '否', '否', '一般', '否']
, ['中年', '否', '否', '好', '否']
, ['中年', '是', '是', '好', '是']
, ['中年', '否', '是', '非常好', '是']
, ['中年', '否', '是', '非常好', '是']
, ['老年', '否', '是', '非常好', '是']
, ['老年', '否', '是', '好', '是']
, ['老年', '是', '否', '好', '是']
, ['老年', '是', '否', '非常好', '是']
, ['老年', '否', '否', '一般', '否']]
data_pd = pd.DataFrame(data, columns=['年龄', '有工作', '有自己的房子', '信贷情况', '类别'])
data_pd.head(3)
年龄 | 有工作 | 有自己的房子 | 信贷情况 | 类别 | |
---|---|---|---|---|---|
0 | 青年 | 否 | 否 | 一般 | 否 |
1 | 青年 | 否 | 否 | 好 | 否 |
2 | 青年 | 是 | 否 | 好 | 是 |
data_pd['年龄'].value_counts()
老年 5 中年 5 青年 5 Name: 年龄, dtype: int64
data_pd.groupby(by='类别').groups
{'否': Int64Index([0, 1, 4, 5, 6, 14], dtype='int64'), '是': Int64Index([2, 3, 7, 8, 9, 10, 11, 12, 13], dtype='int64')}