自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 利用PPO算法训练超级玛丽AI模型

本文讲述PPO强化学习策略的原理,以及利用PPO算法实现超级玛丽游戏AI的代码实现。

2024-07-18 07:36:42 1025

原创 丢鸡蛋问题的拉格朗日插值多项式解法

方法优点是测试次数少,缺点是二分后扔鸡蛋的楼层相比枚举法,鸡蛋碎的风险更高,所以在鸡蛋足够多的情况下这样的扔法可以很快的找到答案。从开始往结局做一次全局平衡,使得开始到结局的每一次结果对于最终的答案影响都尽量是一样的,感觉和动态规范方向相反,特殊情况下和动态规划效果是一样的。假如有K个鸡蛋,一栋N层的楼,为了测试鸡蛋最高在哪一层扔下刚好不碎,并且扔鸡蛋的次数最少。百科中说到动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。

2024-07-11 14:47:41 851

原创 从矩阵对角化到斐波那契数列的解析式

是特征向量阵,通过Mathematica可计算。时间内计算完成,但是我们希望更快。现在我们先把矩阵对角化,分解为。时,可以用传递矩阵表示为。就有了显式的计算公式,

2024-07-11 10:23:12 373

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除