- 博客(6)
- 收藏
- 关注
原创 代码随想录刷题记录(动态规划、单调栈部分)
尽量让石头分成重量相同的两堆(尽可能相同),相撞之后剩下的石头就是最小的.背包容量需要根据题意来估计。i<n;i++){i<n;i++){j--){
2025-12-23 10:47:27
513
原创 代码随想录刷题记录(回溯算法、贪心算法部分)
回溯是一种搜索的方式,是递归的副产品。本质是穷举,可以加一些剪枝来提高效率。所有回溯法的问题都可以抽象为树形结构。
2025-11-25 13:49:16
780
原创 代码随想录刷题记录(栈与队列、二叉树部分)
栈和队列是STL(C++标准库)里面的两个数据结构,STL中栈往往不被归类为容器,而被归类为container adapter(容器适配器)。向外界提供插拔接口。栈的底层实现可以是vector,deque,list 。常用的SGI STL,如果没有指定底层实现的话,默认是以deque为缺省情况下栈的底层结构。用两个栈(输入栈和输出栈)来模拟队列。弹出一个值的时候,需要先 top()获取值,再 pop()移除。225用队列实现栈两个队列,其中一个用来备份。queue是队列,deque是双头队列,命令不一
2025-11-15 21:18:53
666
原创 强化学习入门之李宏毅老师课程笔记(自用)
选取数据来近似期望。不需要知道R的值(红点),这是由环境决定的。这个替换非常常见。(对某一个东西求梯度=某一个东西 *对某一个梯度的log求梯度)近似于求均值只有红色部分跟actor有关。对以上式子求log之后的结果是因为之前我们提到是对R求微分,因此对log求梯度后,只留下与θ有关的部分。这里的R是这一次(s,a)所在轨迹的总的reward。只要R是positive,就提高这个P(a|s),否则降低为什么取log?相当于除以出现的概率,这样就不会偏好出现几率大的action。
2025-11-06 09:57:40
720
原创 KMP代码个人理解(代码随想录)
理论部分理解可以看B站https://www.bilibili.com/video/BV16X4y137qw/?spm_id_from=333.337.search-card.all.click&vd_source=632b7026b0514914474609fbcb231dd0 14分钟的图解非常有用。
2025-11-05 12:03:22
266
原创 纯小白tensorflow2.10连接gpu记录,超简单方法解决
tensorflow2.10.0安装后无法连接gpu,分享一下我解决这个问题的方法。直接使用conda命令安装指定标签的tensorflow,不用单独再去处理cudnn和cuda的安装,最后成功连接gpu。
2024-12-31 23:14:00
1641
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅