ml
文章平均质量分 51
Reikooo
Something classic.
展开
-
数据预处理 _ sklearn.preprocessing中的scale和standardscaler
Sklearn的 Preprocessing模块提供了常见的将原始特征向量转换为更适合下行估计器表示的函数和类. 一般而言,学习算法受益于数据集的标准化,如果数据集当中存在异常值,一些robust scaler和 transformer会更加适用. 在同一个数据集上不同的 scaler, transformer 和normalizer 的表现可以在以下网页上查看:http://scikit-l...翻译 2018-08-22 16:17:47 · 4954 阅读 · 4 评论 -
类别变量的数值转换_独热编码_one-hot
在数据准备阶段如果含有类别变量,可以对它进行 one-hot 编译,将它转换成数值再进行后续分析考虑放入模型等.举个例子,假如 Rank 包含A,B,C三个值:RankABCAAB解决的办法就是向数据集中再加入三个属性,在此命名为Rank_A,Rank_B,Rank_C,如果Rank的值为A,那么这三个属性依次为(1,0,0),Rank值为B,则为(0,1,0),C为(0...原创 2018-08-31 15:55:44 · 2675 阅读 · 1 评论 -
机器学习 - 特征工程 - 构造多项式特征Polynomial Features
简介:特征工程包括特征构建和特征挑选,个人对特征构建的兴趣要大一些,因为在实际项目当中我们往往会发现创造有用的特征比苦苦改进算法的回报率会高很多. 这篇博客想作为构造多项式特征的一个笔记,构建多项式特征是常见的构建新特征的方法之一. 在统计模型当中被广泛用于探索复合变量对y的影响,在机器学习项目当中并不像统计模型那样频繁使用,但我们依然可以用来探索一些我们认为可能会有帮助的变量. 定义:...原创 2018-10-17 16:28:34 · 6089 阅读 · 0 评论