- 博客(15)
- 资源 (6)
- 收藏
- 关注
转载 强化学习论文推荐OpenAI
【导读】OpenAI 在教学资源合集 Spinning Up中发布了强化学习中的关键论文,列举了强化学习不同领域的代表性文章来指导研究者的学习。此外Spinning Up 包含清晰的 RL 代码示例、习题、文档和教程可供参考。Model-Free RLExplorationTransfer and Multitask RLHierarchyMemoryModel-Based RLMeta-RLScaling RLRL in the Real World
2020-05-24 16:20:05
1157
原创 我的强化学习笔记(1)马尔可夫决策过程
我的强化学习代码仓库: https://github.com/ZiyiLiubird/MyRLcodes首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加适应这个环境(接受更多的reward)。强化学习的一个特点之一是,它每一次产生的行为不一定是当前最优的,但若算法收敛的情况下,将是一个全局最优解。每一步只选择当
2020-05-19 22:47:59
1046
原创 关于BFS的一些重要问题
有关入队、出队顺序,是否把节点加入队列状态的判断0-1边权的BFSBFSBFS,节点可以多次入队,因为可能被插入队头,也可能被插入到队尾,所以节点可以多次入队。因此visvisvis数组(记录节点是否被访问过)的判断不能写在for循环里面。当节点第一次出队的时候,所得的路径长度是最短路径长度。for循环里面的更新类似于dijkstradijkstradijkstra等最短路算法的更新方式,只有...
2020-02-01 20:49:09
418
原创 C++内联函数
函数调用在执行时,首先要在栈中为形参和局部变量分配存储空间,然后还要将实参的值赋值给形参,接下来还要将函数的返回地址(该地址指明了函数执行结束后,程序应该回到哪里继续执行)放入栈中,最后才跳转到函数内部执行。这个过程是要耗费时间的。另外,函数执行return语句返回时,需要从栈中回收形参和局部变量占用的存储空间,然后从栈中取出返回地址,再跳转到该地址继续执行,这个过程也要耗费时间。总之,使用函数调...
2019-06-03 10:21:09
235
原创 辨析C++中公有继承,保护继承和私有继承的区别
首先,我们先来看一下C++中类成员的访问范围说明符public,protected和private的区别:public 用来指定公有成员。一个类的公有成员在任何地方都可以被访问。 protected 用来指定保护成员。与private只在继承时访问范围有区别。详细解释见下文。 private 用来指定私有成员。一个类的私有成员,不论是成员变量还是成员函数,都只有在该类...
2019-05-28 14:57:00
2757
转载 Interview: Yoshua Bengio, Yann LeCun, Geoffrey Hinton
Yesterday, for the first time ever, RE•WORK brought together the ‘Godfathers of AI’ to appear not only at the same event, but on a joint panel discussion. At theDeep Learning Summit in Montre...
2019-05-23 22:08:55
490
原创 我的强化学习笔记
为了准备Deecamp的面试,以及源于对自动驾驶的兴趣,笔者着手开始reinforcement learning的学习。写下笔记记录自己的学习过程。 首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加...
2019-05-11 16:05:40
626
转载 南大周志华教授写给学生的话
周老师(个人还是比较喜欢以老师这个高尚的职业称呼他,而不是以个人的title)的简历周志华,男,1973年11月生。分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系 获学士、硕士和博士学位。2001年1月起留校任教。2002年3月破格晋升副教授,2003年11月被聘任为教授,2004年4月获博士生导师资格。2003年获 国家杰出青年科学基金,2006年入选教...
2019-05-05 12:20:43
1540
1
转载 走向真正的人工智能
张钹院士在CCF-GAIR 2018的大会报告第一,什么叫做真正的人工智能?我们的目标是什么? 第二,为什么我们需要真正的人工智能? 第三,我们如何走向真正的人工智能?针对这三个问题,张钹院士首先评论了当前AI技术发展取得的卓越成果,并分析了AI在5个限制条件下的主要应用场景。针对这5个限制条件,张钹院士强调了“有理解的人工智能”的重要性,并给出了一些可能的解决方案,比如在机器...
2019-05-05 11:51:53
712
原创 《Self-Supervised Adversarial Hashing Networks for Cross-Modal Retrieval》论文翻译
2019-04-26 19:27:12
1218
转载 C++中基类的析构函数为什么要用virtual虚析构函数
知识背景要弄明白这个问题,首先要了解下C++中的动态绑定。 关于动态绑定的讲解,请参阅: C++中的动态类型与动态绑定、虚函数、多态实现正题 直接的讲,C++中基类采用virtual虚析构函数是为了防止内存泄漏。具体地说,如果派生类中申请了内存空间,并在其析构函数中对这些内存空间进行释放。假设基类中采用的是非虚析构函数,当删除基类指针指向的派生类对象时就不会触发动态绑定...
2019-04-06 16:30:39
611
转载 人工智能顶级会议与国际期刊总结
这篇文章转载自南京大学周志华教授的博客,原文链接已经找不到了,特此说明。推荐期刊部分选自CCF推荐国际期刊目录。说明: 纯属个人看法, 仅供参考. tier-1的列得较全, tier-2的不太全, tier-3的很不全.同分的按字母序排列.不很严谨地说, tier-1是可以令人羡慕的, tier-2是可以令人尊敬的,由于AI的相关会议非常多, 所以能列进tier-3的也是不错...
2019-04-01 18:42:50
12365
转载 医学影像开源数据集汇总
转载自知乎:https://zhuanlan.zhihu.com/p/24634505;侵删。笔者是在医疗AI领域奋斗的博士生,最近好几位做计算机视觉的好朋友,想尝试医疗领域的影像,Bigdata是AI的燃料,索性把自己之前的藏货拿出来分享一下,大家一起加油!(医学影像的分割、匹配、分类、超分辨、重建等应该都有资源)1、Github上哈佛 beamandrew机器学习和医学影像研...
2019-03-29 15:12:28
11802
5
翻译 《A guide to convolution arithmetic for deep learning》中文翻译
原文作者:Vincent Dumoulin and Francesco Visin; MILA, Université de Montréal;AIRLab, Politecnico di MilanoAll models are wrong, but some are useful. ...
2019-03-27 19:42:54
937
1
原创 区分指针常量与指向常量的指针
首先解释一下什么是指向常量的指针:顾名思义,该指针指向的是一个常量,即不能通过该指针修改其所指对象的值。要想存放常量对象的地址,只能使用常量指针。下面给出例子:const double pi=3.14; //pi是个double型常量,它的值不能被改变double *ptr=π //错误:ptr是一个普通指针,不能存放常量对象的地址const double*c...
2019-03-26 18:49:02
493
1
基于深度学习的图像超分辨率算法论文合集2015-2019(CVPR,ECCV,ICCV)
2019-03-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人