- 博客(2)
- 收藏
- 关注
原创 强化学习(RL)算法
强化学习: Reinforcement learning。它是机器学习的一个领域,不同于机器学习的是,强化学习更强调与环境交互,然后通过计算最大收益获得对应的最优的动作进行行动。强化学习还有一个特点,它是一个序列预测问题,也就是他是为了找出最优的一系列动作。而且因为每一个state需要在前一个action做出后才能得到,所以时间在强化学习中有很重要的意义。
2022-10-28 18:01:34 1375
原创 汇编jmp指令的理解与用法
这篇文章是在学习过程中对于转移地址偏移地址的理解以及网上缺乏帮助理解计算转移地址偏移地址的前提下诞生的。初次写知识点分享,如有误,请指出多包含。JMP是在编写程序中经常使用的指令,它的功能是转移到指令指定的地址执行相应的指令。实际用法如下:1,段内直接转移1)短转移JMP SHORT 转移地址标号功能:改变IP;(即:(IP)=(IP)+8位位移量其中:式子右边(IP)为JMP后第一个字节的偏移地址;8位位移量为JMP机器指令中EB后接的16进制数值。下边我们通过一道例题理解JM
2022-05-07 20:28:17 17446
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人