★★特征工程
特征工程:数据预处理、特征选择等
维格堂406小队
人天生都是软弱的,唯其软弱而犹能承担起苦难,才显出人的尊严。
展开
-
FE01_OneHot-Python应用
Intro onehot的操作,解决两个问题:可以把列名关联上去可以处理之前的value数据构造import pandas as pddf=pd.DataFrame({"id":[1,2,3,4],"grade":["A","B","A","C"],"class":[ "1班","2班","3班","1班"]})pd.get_dummiescategory_feature=["grade","class"]pd.concat([df,pd.get_dummies(df[categ原创 2022-01-12 17:46:40 · 293 阅读 · 0 评论 -
FE01_OneHot-R应用
之前处理类别型变量都没有做处理,甚至没想过做啥变换,我这个建模大概是假的吧。Dummy Variable虚拟变量的含义虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。虚拟变量的作用最开始用树的模型没有考虑过要处理类别型变量,...原创 2020-04-02 14:21:51 · 265 阅读 · 0 评论 -
FE01_OneHot-Scala应用
OneHot是处理类别型变量常用的处理方法,scala中如果应用呢?如果测试集中出现训练集中没有value,怎么处理?1 数据构造import org.apache.spark.ml.{Model, Pipeline, PipelineModel, PipelineStage}import org.apache.spark.ml.classification.LogisticRegres...原创 2020-04-02 11:31:24 · 484 阅读 · 0 评论