pandas里,将李克特量表的字符串,比如
赋值为5, 4, 3, 2, 1
方法如下:
定义一个字典
y_dict = {
"很满意":5,
"满意":4,
"基本满意":3,
"不满意":2,
"很不满意":1
}
然后使用map,这里‘y_sat'是原来的变量,即字符串格式的变量,’y_value‘,就转换成了新变量。5-1的数字。
df['y_value'] = df['y_sat'].map(y_dict)
如果原来的变量里面有缺失值,那么就加上一个fillna
yvalue_na = df['y_sat'].map(y_dict).fillna(9)
yvalue_na.value_counts()
没有确实的话,就是这样的。