学习笔记
文章平均质量分 81
Dominic_S
这个作者很懒,什么都没留下…
展开
-
训练数据样本不均衡问题的处理方法
训练数据样本不均衡问题的处理方法1 不均衡数据出现场景1)搜索引擎的点击预测(网页上推送的广告很多,但被点击的概率往往非常小) 2)电子商务领域的商品推荐(网购平台会推送各种商品,但商品实际被购买的比例很低) 3)信用卡欺诈检测(办理信用卡的用户中,正常合法的用户群占绝大多数,而利用欺诈手段办理信用卡业务的用户很少,建立并训练欺诈检测时样本很不均衡) 4)网络攻击识别 5)疾病诊断...原创 2018-08-22 11:30:56 · 6927 阅读 · 0 评论 -
手撕SVM公式——硬间隔、软间隔、核技巧
1.SVM作用对于给定的训练样本集D={(x1,y1), (x2,y2),… (xn,yn)},yi属于{-1,+1},希望能找出一个超平面,把不同类别的数据集分开,对于线性可分的数据集来说,这样的超平面有无穷多个,而最优的超平面即是分隔间距最大的中间那个超平面2.硬间隔最大化对于以上的KKT条件可以看出,对于任意的训练样本总有ai=0或者yif(xi) - 1=0即yif(xi) =...原创 2018-11-20 11:33:10 · 16820 阅读 · 17 评论 -
几种目标检测网络模型对比(RCNN系列、Mask-RCNN、R-FCN、YOLO、SSD、FPN等)
RCNNRCNN具体原理解析网络分为四个部分:区域划分、特征提取、区域分类、边框回归区域划分:使用selective search算法画出2k个左右候选框,送入CNN特征提取:使用imagenet上训练好的模型,进行finetune区域分类:从头训练一个SVM分类器,对CNN出来的特征向量进行分裂边框回归:使用线性回归,对边框坐标进行精修优点:ss算法比滑窗得到候选框高效一些;使用...原创 2018-11-20 11:32:56 · 24581 阅读 · 0 评论