自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习中,数据分布不平衡的处理方法

假如有个案例,正负样本数目比例是130:1,极端数据不平衡,可能尝试的解决方法1.对正样本降采样2,负样本增采样3,。人造样本,对于负样本添加噪声,任为负样本4,对于不同样本的loss function设定不一样,具体情况具体分析5,分层采样,用随机采样,分成10份6.针对正样本随机采样分成10份,然后负样本加入到每个正样本中,样本正负比变成13:1,降低数据不平衡7,模型融合,不同的算法得到不同...

2018-04-27 23:09:49 1927

原创 聚类方法分类

1.原型聚类:典型的做法是K-means,首先设定k个类别,随机的在总体样本中选择k个样本作为聚类中心,然后遍历所有样本点,把所有样本点分类到k个类中(以最短距离为标准),然后更新k个样本的样本中心,再重新划分所有的样本点。停止条件可以设定为样本的变化幅度不大的情况,或者两次的损失函数变化不大的情况。优点:简单、时间复杂度、空间复杂度低缺点:随机初始化的中心点对结果影响很大;2.层次聚类:就是对所...

2018-04-27 22:57:25 3333

原创 剑指offer原题:输入n个整数,找出其中最小的K个数。

输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。显然可以考虑用快排的思想,这是比较常规的做法,就是选定一个temp,然后计数比这个temp小的数有多少,和k做比较,如果count小于k,继续利用快排的思想,递归,就是还要寻找k-count个,在比temp大的数里面。本文尝试用堆排的思想,这也是可以的;首先写出最小堆的的调整算...

2018-04-08 22:34:47 2467

DRCN超分论文,ppt和代码

2016论文,全部实现过程。利用RNN做图像块特征的映射。网络分为三个部分,第一部分提取图像特征,第二部分做图像块之间的映射,第三部分做图像的重建。

2017-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除