1. 特征工程
突然看到了这个名词:
介绍特征处理的比较好的:https://www.zhihu.com/question/29316149
2. 数据预处理
归一化和标准化的区别
总的来说:
- 归一化和标准化都是一种线性变化
- . 归一化的缩放是拍扁到统一的区间(由极值决定)
- 标准化是跟整体的分布有关
什么时候用什么
- 如果对输出结果范围有要求,用归一化
- 如果数据较为稳定,不存在极端的最大最小值,用归一化
- 如果数据存在异常值和较多噪音,用标准化
一般使用标准化,因为如果对数据分布有要求的话,强行变成(0,1)会影响数据的分布。
3. 去除背景
可以阅读的技术贴
Camelyon16 冠军
google团队
百度NCRF
其他