特征工程
特征分析与构造
dzzxjl
大数据 & 推荐算法 工程师
展开
-
User-Item特征
User基本属性、行为统计、画像偏好、实时行为几类特征Item统计行为基本属性物品作者侧的特征Context交互时间网络环境等User-Item交互行为浏览点击点赞转发评论关注推荐支付原创 2022-01-05 00:45:00 · 406 阅读 · 0 评论 -
【FE】特征选择方法
皮尔逊系数在统计学当中,皮尔逊相关性系数被广泛应用于测量2个变量 X、Y 的相关程度,皮尔逊相关性系数的值在(-1.0,1.0),绝对值越大,则2个变量间的相关性则越强。卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。卡方值越大,标识两个变量之间的关联性越大,越相关,即是越不独立。def transFeature(data, c.原创 2021-12-21 00:45:00 · 465 阅读 · 0 评论