特征可以被选择(筛选、过滤)的前提是,原始的特征空间中存在:
(1)冗余特征(redundant feature),比如年龄与生日
(2)与目标问题不相关特征(irrelevant feature),保险类型与最终的癌症预测。
原始的 x=(x1,x2,…,xd)→ϕ(x)=(xi1,xi2,…,xid′) ,此时的 ϕ 就被称为 subset-transform。
特征可以被选择(筛选、过滤)的前提是,原始的特征空间中存在:
(1)冗余特征(redundant feature),比如年龄与生日
(2)与目标问题不相关特征(irrelevant feature),保险类型与最终的癌症预测。
原始的 x=(x1,x2,…,xd)→ϕ(x)=(xi1,xi2,…,xid′) ,此时的 ϕ 就被称为 subset-transform。