- 博客(2)
- 资源 (1)
- 收藏
- 关注
转载 【算法】xgboost
https://blog.csdn.net/github_38414650/article/details/76061893https://blog.csdn.net/sb19931201/article/details/52557382https://blog.csdn.net/yinyu19950811/article/details/81079192
2018-05-15 11:17:55 667
转载 【数据预处理】特征处理流程 标准化|正则化
首先要明确有多少特征,哪些是连续的,哪些是类别的。检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。对连续的数值型特征进行标准化,使得均值为0,方差为1。对类别型的特征进行one-hot编码。将需要转换成类别型数据的连续型数据进行二值化。为防止过拟合或者其他原因,选择是否要将数据进行正则化。在对数据进行初探之后发现效果不佳,可以尝试使用多项式方法,寻找非线性的关系。根据实际问题分析是...
2018-05-07 13:49:08 1202
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人