- 博客(2)
- 收藏
- 关注
原创 Q-learing
一.概述 Q-Learning是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。 二. 引例 下图,是一个迷宫游戏 游戏规则如下: 按步积分系统来评估。 你在每一步都会失去 1 分(每一步失...
2020-06-08 12:05:07
337
原创 人脸图片加口罩
fromPILimportImage importdlib importnumpyasnp importcv2 fromPILimportImage defchristmas(img,x,y,w,h): im=Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB)) mark=Image.open("口.png") mark=mark.resize((w,h)) lay...
2020-05-23 18:12:43
525
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人