星行夜空
码龄6年
求更新 关注
提问 私信
  • 博客:119,969
    社区:1
    119,970
    总访问量
  • 37
    原创
  • 2,618
    粉丝
  • 44
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
加入CSDN时间: 2019-04-12
博客简介:

Kiek17的博客

查看详细资料
个人成就
  • 获得236次点赞
  • 内容获得47次评论
  • 获得782次收藏
  • 代码片获得12,948次分享
  • 博客总排名141,832名
  • 原力等级
    原力等级
    5
    原力分
    1,288
    本月获得
    8
创作历程
  • 4篇
    2024年
  • 22篇
    2023年
  • 4篇
    2022年
  • 7篇
    2021年
成就勋章
TA的专栏
  • 强化学习
    15篇
  • office
    2篇
  • 生产力工具
    1篇
  • 文献阅读
    2篇
  • 笔记入门
    1篇
  • obsidian
    2篇
  • zotero
    1篇
  • 毕设
    1篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 1

TA参与的活动 0

兴趣领域 设置
  • 人工智能
    tensorflow
创作活动更多

『技术文档』写作方法征文挑战赛

在技术的浩瀚海洋中,一份优秀的技术文档宛如精准的航海图。它是知识传承的载体,是团队协作的桥梁,更是产品成功的幕后英雄。然而,打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼?是否纠结于文档结构与内容的完美融合?无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

50人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

VBA代码

EXCEL宏入门
原创
发布博客 2024.10.12 ·
975 阅读 ·
25 点赞 ·
0 评论 ·
27 收藏

Python调用GPT:保持登陆状态,重复对话,复制对话结果,自动退出

用Python实现GPT的重复性对话, 并且读取对话结果
原创
发布博客 2024.05.31 ·
402 阅读 ·
4 点赞 ·
0 评论 ·
1 收藏

Python处理扫描的PDF文件:图像OCR处理+pytesseract安装+文字提取

利用OCR (Optical Character Recognition,光学字符识别)技术,把扫描的pdf变成文字版本
原创
发布博客 2024.05.31 ·
2217 阅读 ·
13 点赞 ·
0 评论 ·
25 收藏

python画图:matpolt,设置图片尺寸,字体大小,副坐标轴,保存

matpolt:设置图片尺寸,字体大小,副坐标轴,保存成svg
原创
发布博客 2024.05.26 ·
1128 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

RLlib,调参的基本概念(Tune)

如何使用ray的tune进行调参
原创
发布博客 2023.12.28 ·
1153 阅读 ·
16 点赞 ·
0 评论 ·
23 收藏

RLlib:用户自定义模型代码示例

RLlib中如何自定义模型
原创
发布博客 2023.12.27 ·
1028 阅读 ·
9 点赞 ·
0 评论 ·
9 收藏

毕设论文要求&&Latex入门教程

本模板对常用的latex进行了介绍,后续还会继续完善
原创
发布博客 2023.12.21 ·
1374 阅读 ·
25 点赞 ·
0 评论 ·
25 收藏

Ray RLlib User Guides:模型,处理器和动作分布

Ray的RLlib的用户手册,模型部分
原创
发布博客 2023.12.13 ·
495 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

RLLIB:algo = Algorithm.from_checkpoint(ckpt)遇到error 3

rllib的algo = Algorithm.from_checkpoint(ckpt)遇到error 3,从c盘拷贝文件到c盘发现路径不存在,两个路径一个比一个奇怪。升级ray的版本,我之前是2.6,升级到2.8就好了。
原创
发布博客 2023.12.09 ·
143 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

RLlib七:github上的代码示例

Rllib上的代码示例
原创
发布博客 2023.12.07 ·
291 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

obsidian官网下载太慢

obsidian下载
原创
发布博客 2023.11.27 ·
1841 阅读 ·
0 点赞 ·
3 评论 ·
6 收藏

github上不去

登陆fastgithub
原创
发布博客 2023.11.25 ·
175 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

深度强化学习中的动作屏蔽(Action Masking)

在复杂环境中使用动作屏蔽,实现更好的训练效果
原创
发布博客 2023.11.22 ·
3737 阅读 ·
9 点赞 ·
0 评论 ·
31 收藏

get_cli_args函数

get_cli_args函数是什么,store_true是什么
原创
发布博客 2023.11.20 ·
229 阅读 ·
6 点赞 ·
0 评论 ·
0 收藏

RLlib六:实战用户环境

ray-rllib实战
原创
发布博客 2023.11.20 ·
338 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

RLlib五:如何丝滑使用RLlib

您可以提供在策略评估期间调用的回调。这些回调可以访问当前事件的状态。某些回调,如on_postprocess_trajectory、on_sample_end和on_train_result也是可以对中间数据或结果应用自定义后处理的地方。用户定义的状态可以为迭代中的episode.user_data dict,以及通过保存值到来报告的自定义标量指标 episode.custom_metrics dict。这些自定义指标custom_metrics将被聚合并作为训练结果的一部分报告。
原创
发布博客 2023.11.14 ·
1072 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

RLlib四:Algorithms 强化学习典型算法总结

现有的基本强化学习方法总结,RLlib包含的RL算法总结,包括PPO,DQN等,包括多智能体RL算法简介
原创
发布博客 2023.11.14 ·
1317 阅读 ·
4 点赞 ·
0 评论 ·
2 收藏

RLlib三:环境

RLlib适用于几种不同类型的环境,包括Farama-Foundation Gymnasium、用户定义、多智能体环境以及批处理环境。并非所有环境都适用于所有算法。查看算法概述以获取更多信息。
原创
发布博客 2023.11.14 ·
884 阅读 ·
1 点赞 ·
1 评论 ·
7 收藏

RLlib二:强化学习(RLlib)的关键概念

算法类的**training_step()**方法定义了位于任何算法核心的可重复执行逻辑。将其视为研究论文中算法伪代码的python实现。您可以使用training_step()来表达您希望如何协调从环境中收集样本、将这些数据移动到算法的其他部分,以及跨不同分布式组件更新和管理策略权重。简而言之,如果开发人员想要对现有算法进行自定义更改、从头开始编写自己的算法或从论文中实现一些算法,他们将需要覆盖/修改“training_step”方法。
原创
发布博客 2023.11.13 ·
883 阅读 ·
10 点赞 ·
0 评论 ·
6 收藏

RLlib一:RLlib入门

强化学习库,RLlib入门
原创
发布博客 2023.11.13 ·
2962 阅读 ·
6 点赞 ·
0 评论 ·
20 收藏
加载更多