- 博客(4)
- 收藏
- 关注
原创 特征相关内容总结
特征编码示例原始值实数 (0.23432)离散 (1 | 2 | 3 …)多个值 (1,3,4)channel: one-hottag: 电影、国内、动作编码方式所有编码方式都可转化为以下三类:单值 ( 离散:0,1 ; 稠密:float(归一化) )怎么归一化?one-hot,分桶方式?向量 (embedding)归一化?hash 稀疏特征 ( tag,id… )怎么hash?怎么处理多值?特征示例数据示例编码方式
2020-10-08 16:58:05 340
原创 常用数据格式
libsvm1 1:1 214:1 233:1 234:1dummy1 1 214 233 234csv(csv格式为每个数据由逗号“,”分隔)0.29,0.31,32.8,92.5,22,20,0.7750820447097237,0.5326322957198866 0.61,0.76,7.8,84.4,42,40,0.6650599517190358,0.47773242152197465 0.21,0.23,19.8,84.8,31,30,0.6798212287221709,0.67
2020-10-08 16:53:53 787
原创 LR
LR原理以及公式推导 为什么logistic回归的要用sigmoid函数?优缺点? Linear SVM与LR的异同 LR的损失函数的公式和函数 LR如何解决共线性,为什么深度学习不强调 LR如何防止过拟合 LR分布式训练怎么做...
2019-04-07 19:38:50 306
原创 算法工程师面试准备
分类回归模型LR GBDT 原理以及公式推导 ID3和C4.5的优缺点,树的融合 GBDT的参数怎么调 boost算法的思路是什么样的?讲一下你对adaboost 和 gbdt的了解? 决策树处理连续值的方法 优缺点,适用场景以及如何选型 ID3,C4.5,CART等,决策树的split原理和剪枝策略 ID3和C4.5的优缺点,树的融合 RF(随机森林) ...
2019-03-17 22:22:39 411
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人