特征工程
文章平均质量分 92
阿君聊风控
一名有7年以上电商和互金小贷的风控算法工程师,乐于风控经验和知识的传播,期待找到同行交流风控经验
展开
-
特征工程
特征工程 特征处理 1)数值型 归一化 numpy.preprocession.MinMaxScaler() #归一化到【0,1】之间 preprocession.StandardScaler() #约束到成一个均值为0,方差为1的数据范围 log等变化 统计值 max、min、mean、std pandas.series.describe() 离散化:分桶 等宽分桶:每个桶左右边界值之差相同[0,2], [2,4], [4,6] 等频分桶:每个桶内的样本数相等 [0,1], [1,3],[原创 2020-05-26 19:06:52 · 267 阅读 · 0 评论 -
特征开发总结
文章目录(1)数据结构的选择(2)如果枚举型参数较多,可以将参数写入列表或者字典中,避免平铺,使得代码更简练(3)将代码模块化|工具化(4)挖掘特征时,要将特征有条理的分类,将每一类特征写到一个函数中,函数中可以包含子函数(5)集合的浅拷贝和深拷贝(6)用户的profile信息如何衍生特征:(7)使用numpy 和pandas进行数据的统计和转化(8)分层批量计算特征:(9)交叉验证(10)数据格...原创 2020-01-08 19:53:40 · 648 阅读 · 0 评论