![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
代码开发
文章平均质量分 70
记录代码开发过程的一些小心得、小技巧
邵政道
这个作者很懒,什么都没留下…
展开
-
【算法】用python代码解决“鬼谷问徒”问题
一天,鬼谷子随意从2-99中选取了两个数。他把这两个数的和告诉了庞涓,把这两个数的乘积告诉了孙膑,但孙膑和庞涓彼此不知到对方得到的数。第二天,庞涓很有自信的对孙膑说:虽然我不知到这两个数是什麽,但我知道你一定也不知道。随后,孙膑说:那我知道了。过一会儿,庞涓说:那我也知道了。原创 2023-02-20 21:42:44 · 1219 阅读 · 0 评论 -
【代码开发】docker查看并解除CPU数量限制
参数根据自己需要调整。原创 2022-07-21 15:16:17 · 3929 阅读 · 1 评论 -
【代码开发】python一个终端运行多个进程
验证算法鲁棒性的时候,需要使用不同的10个随机种子,训练10个agent。如果串行运行的话,会导致程序运行时间变为原来的10倍。如果同时启用十个终端运行的话,手动操作起来会非常麻烦。使用python的库,在一个终端中运行多个进程。...原创 2022-07-21 14:57:51 · 751 阅读 · 2 评论 -
【代码开发】RLCard平台强化学习模型训练入门
最近科研需要一个合适的牌类环境,经过调研RLCard最适合自己上手,更容易进行环境接口的改动。写一篇自己最近对RLCard平台开发过程中的一些“经验”吧。文章目录平台介绍安装代码结构平台介绍RLCard: A Toolkit for Reinforcement Learning in Card GamesRLCard is a toolkit for Reinforcement Learning (RL) in card games. It supports multiple card envir原创 2022-05-25 18:08:14 · 2398 阅读 · 1 评论 -
【代码开发】neuron_poker安装及简单使用
文章目录引子安装Anaconda安装环境及相关依赖运行代码引子最近调研了蛮多能跑德州扑克的平台,但有些代码太老,有些太过复杂,很难找到开源的、方便的代码供研究。最近发现neuron_poker,考虑安装的复杂程度、代码阅读难度、运行效率等因素,综合来看算是不错,而且还带有GUI界面,唯一的遗憾就是里面Keras和torch.keras混用,而我pytorch用的比较多,所以没有深入研究。本文简单介绍一下neuron_poker的安装及使用。这是一个用于强化学习研究德州扑克的环境,主要用于学术研究。gi原创 2022-05-05 14:34:14 · 722 阅读 · 1 评论 -
【代码开发】选择一维数组中最大的k个
现在回顾本文,其实就是一个因为不熟悉库函数而自己去实现的愚蠢故事。记住,下次自己想实现一些基础功能的时候,一定要先去看看能用上哪些库函数。文章目录目标函数实现优化改进优化后函数总结目标在自己写代码的时候,碰到一个蛮有意思的函数。有点像算法题,目标是用torch和numpy的库函数实现。先介绍一下函数的目标,就是从一个n行m列的数组中,选出每m个中最大的k个,返回一个n*k的数组,每个元素是对应k个元素的下标。返回下标可以乱序。def select_maxk(arr, pick_num=1)ar原创 2022-04-27 09:38:53 · 2032 阅读 · 0 评论