- 博客(2)
- 收藏
- 关注
原创 Q-learing
一.概述 Q-Learning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。二. 引例下图,是一个迷宫游戏游戏规则如下:按步积分系统来评估。你在每一步都会失去 1 分(每一步失...
2020-06-08 12:05:07 343
原创 人脸图片加口罩
fromPILimportImageimportdlibimportnumpyasnpimportcv2fromPILimportImagedefchristmas(img,x,y,w,h):im=Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))mark=Image.open("口.png")mark=mark.resize((w,h))lay...
2020-05-23 18:12:43 528
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人