问题1:什么是好特征?
越具备区分能力的特征(能够很方便地根据这个特征区分出类别)就越是好特征;
比如对猫狗分类:脚的个数没啥区分能力,都是四只脚,但是鼻子样子很好作为区分依据,这个就是比较好的特征。
问题2:选取特征应该如何选?
无意义的信息(不能作为分类依据的特征)就是坏特征;比如区分猫狗类别的时候,猫狗的脚个数。
重复性的信息:比如猫狗高度特征,一个用cm表示高度,一个用M表示高度,这属于重复特征。
复杂的信息:比如找两个点的路线,尽量去找两个点的距离,而非两个点的经纬度,避免更复杂。