这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。
11.理解One Hot Encodeing原理及作用?
问题由来
在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。
例如,考虑以下的三个特征:
["male","female"]
["from Europe","from US","from Asia"]
["use Firefox","uses Chrome","uses Safari","uses Internet Explorer"]
如果将上述特征用数字表示,效率会高很多。例如:
["male","from US","uses Internet Explorer"]表示为[0,1,3]
["female","from Asia","uses Chrome"]表示为[1,2,1]
但是,即使转换为数字表示后,上述数据也不能直接用在我们的分类器中。因为,分类