自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 什么是交叉熵

熵的本质是香农信息量()的期望。现有关于样本集的2个概率分布p和q,其中p为真实分布,q非真实分布。按照真实分布p来衡量识别一个样本的所需要的编码长度的期望(即平均编码长度)为:H(p)=。如果使用错误分布q来表示来自真实分布p的平均编码长度,则应该是:H(p,q)=。因为用q来编码的样本来自分布p,所以期望H(p,q)中概率是p(i)。H(p,q)我们称之为“交叉熵”。比如含有4个字母(A,B,...

2018-03-16 22:17:54 1289

原创 Trust region policy optimization笔记

Trust region policy optimization笔记一、 论文解决的问题相比于值函数方法,策略搜索算法无疑具有很多的优点。(1) 直接策略搜索方法是对策略π进行参数化表示,与值函数方中对值函数进行参数化表示相比,策略参数化更简单,有更好的收敛性。(2)值函数方法无法求解动作空间很大或者动作为连续集的问题。)策略搜索算法目前发展最迅速的是策略梯度方法。然而策略梯度方法存在着学习速率

2017-11-28 19:57:46 1748

原创 马尔可夫决策过程(MDP)

1.什么是马尔可夫性?马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态无关。2.什么是马尔可夫决策过程?马尔可夫决策过程(MDPs)以安德烈马尔可夫的名字命名 ,针对一些决策的输出结果部分随机而又部分可控的情况,给决策者提供一个决策制定的数学建模框架。MDPs对通过动态规划和强化学习来求解的广泛的优化问题是非常有用的。MDPs至少早在20世纪50年代就被大家熟知

2017-11-07 17:17:28 1260

原创 Fast convolutional neural network training using selective data sampling 笔记

论文目的提出了一种选择性抽样方法去训练CNN网络,用来检测眼底图片中的出血块。最终实现了训练时间从170个时间周期减少到60个时间周期,并且性能提高。实验使用了两个数据集-Kaggle and Messidor。实现步骤图像预处理使用Circular template matching去获取感兴趣的区域resize图片大小到512*512调整图像对比度,公式如下:Ice(x,y;σ) = αI(x

2017-09-08 20:26:35 1025

原创 Deep CNNs for Diabetic Retinopathy Detection笔记

Deep CNNs for Diabetic Retinopathy Detection笔记1.主要工作使用卷积神经网络实现DR的两种分类(都是2分类模型);2.数据集Kagglean epoch was set to 2000 training examplesnumber of postive(眼底正常类) and negative(1-4级非正常类) examples are equal.3.

2017-09-08 19:56:45 2428 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除