【小白从小学Python、C、Java】
【Python-计算机等级考试二级】
【Python-数据分析】
Python数据分析
数据预处理
特征值独热编码
独热编码,是一种将分类变量转换为若干二进制列的方法,其中1表示属于该类别的行。这种方法有效的诠释了分类变量的含义且去除了类别对应的值的大小在机器学习过程中对结果产生的影响。
以下python代码是对数据框数据car_data中“品牌”列分类数据做独热编码:
dummy_data = pd.get_dummies(car_data["品牌"], prefix="品牌", dummy_na = False, drop_first = True)
以下选项正确的选项是?
A选项:函数将对原数据中所有类别进行编码
B选项:新的列列名中添加了“品牌”作为前缀
C选项:新的列列名中前缀和类别是以空格作为分割的
D选项:函数将把原数据中的缺失值看作一类,对nan类型也进行编码
正确答案是:B
[太阳]温馨期待
期待大家提出宝贵建议,互相交流,收获更大,助教:dmx
欢迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:https://liujingwei.cn