- 博客(7)
- 资源 (10)
- 收藏
- 关注
原创 训练过程中常见问题总结
问题1:Loss下降,但accuracy(或auc)不升。解答:正常,Loss和acc计算方式不同,是两个完全不同的东西。acc只关心预测正确,而不关心正确的程度(比如预测狗和猫,不论模型预测是猫的概率是51%还是99%,对acc来说是一样的)。但是loss函数(如cross_entropy_loss)考虑了预测的正确程度。所以会出现预测正确的数量不变,但是正确的置信度越来越高了。问题2:Lo...
2018-10-27 11:30:34 5611 1
原创 常用样本数据格式
常用样本数据格式1 libsvm格式每行文本表示一个样本,每个字段以" "(空格)分隔,每行的文本格式label index1:value1 index2:value1 index3:value3 ...其中label字段:字段类型:Int当输入数据是训练数据,label为样本的标签,二分类算法label是{0, 1},多分类算法label是{0, 1, 2, …, n} ;...
2018-10-03 11:40:47 3071
原创 GLM到FM到FFM到DeepFM
GLM(General Linear Model)y=w0+∑i=1nwixiy = w_0 + \sum_{i=1}^nw_ix_iy=w0+i=1∑nwixiFM(Factorization Machine)y=w0+∑i=1nwixi+∑i=1n∑j=i+1nwijxixjy = w_0 + \sum_{i=1}^nw_ix_i + \sum_{i=1}^{n}\sum_{j=...
2018-10-02 13:39:46 344
原创 店铺、商品质量分
店铺、商品质量分目标:成交、停留时长等特征:实体维度:商品、商家时间维度:1天、7天、30天、90天。行为维度:曝光、浏览、收藏、加购、购买、评价、退款、复购、详情页停留时间、IM回复。统计维度:pv、uv、点击率、转化率、GMV、时长。模型:XGBOOST可解释性,特征重要度。特征重要度Reference:https://zhuanlan.zhihu.com/p/355...
2018-10-02 13:37:00 587
原创 Logloss详解
定义:−(ylog(p)+(1−y)log(1−p))-{(y\log(p) + (1 - y)\log(1 - p))}−(ylog(p)+(1−y)log(1−p))yyy表示样本的真实标签(1或-1),ppp表示模型预测为正样本的概率。可视化:下图展示了lable=1时对数损失值的范围。当预测概率接近1时,对数损失缓慢下降。但随着预测概率的降低,对数损失迅速增加。对数损失对两种类...
2018-10-02 13:21:36 32342 4
原创 非均衡样本学习(Learning from Imbalanced Data)
非均衡样本学习(Learning from Imbalanced Data)1.Undersampling1.1Informed Undersampling2.Oversampling2.1SMOTE(Synthetic Minority Oversampling Technique)
2018-10-02 13:13:55 966
使用颜色纹理直方图来进行目标跟踪
2012-11-22
多目标行人检测
2012-11-22
PCA降维程序
2012-11-22
LAMP_HMM 隐马尔科夫模型
2012-05-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人