数据分析
文章平均质量分 56
cmj28
这个作者很懒,什么都没留下…
展开
-
特征工程-数据预处理
特征工程-数据预处理 1、标准化 值转换为0,方差为1的分布 如SVM的RBF核和线性模型的L1和L2正则化项,都假设所有特征的均值都为零,并且方差在同一个数量级。如果一个特征的方差比其余特征的方差大许多个数量级,那么该特征将会主导整个目标函数,使得模型不能从其余特征学习到数据的特征 from sklearn import preprocessing X_scaled = preprocessing.scale(X,with_mean=True,with_std=True) #原创 2021-05-09 20:40:46 · 200 阅读 · 0 评论 -
python-pandas/sklearn中进行的编码方法
python-pandas/sklearn中进行的编码方法 1、进行将字符串一个或多个特征属性下的多个类别进行转化为1,2,3 … 1)、进行导入的库 from sklearn.preprocessing import LabelEncoder 2)、举例说明 data[object_data]=data[object_data].apply(LabelEncoder().fit_transform) 2、使用字符串独热进行转换 1)、方法一:使用pandas中进行独热编码 (1)、进行导入的库 imp原创 2021-05-05 21:17:41 · 1445 阅读 · 0 评论