GYY_981009-CSDN博客

原创 Q-learing

一.概述 Q-Learning是强化学习算法中value-based的算法，Q即为Q（s,a）就是在某一时刻的 s 状态下(s∈S)，采取动作a (a∈A)动作能够获得收益的期望，环境会根据agent的动作反馈相应的回报reward r，所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值，然后根据Q值来选取能够获得最大的收益的动作。二. 引例下图，是一个迷宫游戏游戏规则如下：按步积分系统来评估。你在每一步都会失去 1 分（每一步失...

2020-06-08 12:05:07 343

原创人脸图片加口罩

fromPILimportImageimportdlibimportnumpyasnpimportcv2fromPILimportImagedefchristmas(img,x,y,w,h):im=Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))mark=Image.open("口.png")mark=mark.resize((w,h))lay...

2020-05-23 18:12:43 528

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Q-learing

原创 人脸图片加口罩

空空如也

空空如也

原创人脸图片加口罩