自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (6)
  • 收藏
  • 关注

转载 强化学习论文推荐OpenAI

【导读】OpenAI 在教学资源合集 Spinning Up中发布了强化学习中的关键论文,列举了强化学习不同领域的代表性文章来指导研究者的学习。此外Spinning Up 包含清晰的 RL 代码示例、习题、文档和教程可供参考。Model-Free RLExplorationTransfer and Multitask RLHierarchyMemoryModel-Based RLMeta-RLScaling RLRL in the Real World

2020-05-24 16:20:05 1157

原创 我的强化学习笔记(1)马尔可夫决策过程

我的强化学习代码仓库: https://github.com/ZiyiLiubird/MyRLcodes首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加适应这个环境(接受更多的reward)。强化学习的一个特点之一是,它每一次产生的行为不一定是当前最优的,但若算法收敛的情况下,将是一个全局最优解。每一步只选择当

2020-05-19 22:47:59 1046

原创 关于BFS的一些重要问题

有关入队、出队顺序,是否把节点加入队列状态的判断0-1边权的BFSBFSBFS,节点可以多次入队,因为可能被插入队头,也可能被插入到队尾,所以节点可以多次入队。因此visvisvis数组(记录节点是否被访问过)的判断不能写在for循环里面。当节点第一次出队的时候,所得的路径长度是最短路径长度。for循环里面的更新类似于dijkstradijkstradijkstra等最短路算法的更新方式,只有...

2020-02-01 20:49:09 418

原创 C++内联函数

函数调用在执行时,首先要在栈中为形参和局部变量分配存储空间,然后还要将实参的值赋值给形参,接下来还要将函数的返回地址(该地址指明了函数执行结束后,程序应该回到哪里继续执行)放入栈中,最后才跳转到函数内部执行。这个过程是要耗费时间的。另外,函数执行return语句返回时,需要从栈中回收形参和局部变量占用的存储空间,然后从栈中取出返回地址,再跳转到该地址继续执行,这个过程也要耗费时间。总之,使用函数调...

2019-06-03 10:21:09 235

原创 辨析C++中公有继承,保护继承和私有继承的区别

首先,我们先来看一下C++中类成员的访问范围说明符public,protected和private的区别:public 用来指定公有成员。一个类的公有成员在任何地方都可以被访问。 protected 用来指定保护成员。与private只在继承时访问范围有区别。详细解释见下文。 private 用来指定私有成员。一个类的私有成员,不论是成员变量还是成员函数,都只有在该类...

2019-05-28 14:57:00 2757

转载 Interview: Yoshua Bengio, Yann LeCun, Geoffrey Hinton

Yesterday, for the first time ever, RE•WORK brought together the ‘Godfathers of AI’ to appear not only at the same event, but on a joint panel discussion. At theDeep Learning Summit in Montre...

2019-05-23 22:08:55 490

原创 我的强化学习笔记

为了准备Deecamp的面试,以及源于对自动驾驶的兴趣,笔者着手开始reinforcement learning的学习。写下笔记记录自己的学习过程。 首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加...

2019-05-11 16:05:40 626

转载 南大周志华教授写给学生的话

周老师(个人还是比较喜欢以老师这个高尚的职业称呼他,而不是以个人的title)的简历周志华,男,1973年11月生。分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系 获学士、硕士和博士学位。2001年1月起留校任教。2002年3月破格晋升副教授,2003年11月被聘任为教授,2004年4月获博士生导师资格。2003年获 国家杰出青年科学基金,2006年入选教...

2019-05-05 12:20:43 1540 1

转载 走向真正的人工智能

张钹院士在CCF-GAIR 2018的大会报告第一,什么叫做真正的人工智能?我们的目标是什么? 第二,为什么我们需要真正的人工智能? 第三,我们如何走向真正的人工智能?针对这三个问题,张钹院士首先评论了当前AI技术发展取得的卓越成果,并分析了AI在5个限制条件下的主要应用场景。针对这5个限制条件,张钹院士强调了“有理解的人工智能”的重要性,并给出了一些可能的解决方案,比如在机器...

2019-05-05 11:51:53 712

原创 《Self-Supervised Adversarial Hashing Networks for Cross-Modal Retrieval》论文翻译

2019-04-26 19:27:12 1218

转载 C++中基类的析构函数为什么要用virtual虚析构函数

知识背景要弄明白这个问题,首先要了解下C++中的动态绑定。 关于动态绑定的讲解,请参阅: C++中的动态类型与动态绑定、虚函数、多态实现正题 直接的讲,C++中基类采用virtual虚析构函数是为了防止内存泄漏。具体地说,如果派生类中申请了内存空间,并在其析构函数中对这些内存空间进行释放。假设基类中采用的是非虚析构函数,当删除基类指针指向的派生类对象时就不会触发动态绑定...

2019-04-06 16:30:39 611

转载 人工智能顶级会议与国际期刊总结

这篇文章转载自南京大学周志华教授的博客,原文链接已经找不到了,特此说明。推荐期刊部分选自CCF推荐国际期刊目录。说明: 纯属个人看法, 仅供参考. tier-1的列得较全, tier-2的不太全, tier-3的很不全.同分的按字母序排列.不很严谨地说, tier-1是可以令人羡慕的, tier-2是可以令人尊敬的,由于AI的相关会议非常多, 所以能列进tier-3的也是不错...

2019-04-01 18:42:50 12365

转载 医学影像开源数据集汇总

转载自知乎:https://zhuanlan.zhihu.com/p/24634505;侵删。笔者是在医疗AI领域奋斗的博士生,最近好几位做计算机视觉的好朋友,想尝试医疗领域的影像,Bigdata是AI的燃料,索性把自己之前的藏货拿出来分享一下,大家一起加油!(医学影像的分割、匹配、分类、超分辨、重建等应该都有资源)1、Github上哈佛 beamandrew机器学习和医学影像研...

2019-03-29 15:12:28 11802 5

翻译 《A guide to convolution arithmetic for deep learning》中文翻译

原文作者:Vincent Dumoulin and Francesco Visin; MILA, Université de Montréal;AIRLab, Politecnico di MilanoAll models are wrong, but some are useful. ...

2019-03-27 19:42:54 937 1

原创 区分指针常量与指向常量的指针

首先解释一下什么是指向常量的指针:顾名思义,该指针指向的是一个常量,即不能通过该指针修改其所指对象的值。要想存放常量对象的地址,只能使用常量指针。下面给出例子:const double pi=3.14; //pi是个double型常量,它的值不能被改变double *ptr=π //错误:ptr是一个普通指针,不能存放常量对象的地址const double*c...

2019-03-26 18:49:02 493 1

基于深度学习的图像超分辨率算法论文合集2015-2019(CVPR,ECCV,ICCV)

本合集涵盖了2015-2019年发表在计算机视觉三大顶级会议上的基于深度学习的图像超分辨率算法的大多数论文。

2019-03-31

上海交大ACM班课程pdf.zip

本资源为上海交通大学ACM班机器学习课程(张伟南授)的全部PPT文件。

2019-07-31

CS294-158 课件PDF.rar

本课程要求具有 CS 189 或同等学力。本课程将假定你已了解强化学习、数值优化和机器学习的相关背景知识。

2019-06-13

David_Silver.zip

本资源为David_Sliver开设课程强化学习的全部教材与PPT文件。

2019-07-31

CS231n课程笔记

斯坦福大学计算机视觉课程CS231n的课程笔记,高清有代码。

2019-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除