strawberry47
码龄7年
关注
提问 私信
  • 博客:212,183
    社区:716
    212,899
    总访问量
  • 104
    原创
  • 41,958
    排名
  • 162
    粉丝
  • 6
    铁粉
  • 学习成就

个人简介:研究方向:强化学习、推荐系统、多智能体。 qq邮箱:852086890@qq.com

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2018-05-04
博客简介:

strawberry47的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    5
    当前总分
    1,104
    当月
    6
个人成就
  • 获得314次点赞
  • 内容获得126次评论
  • 获得972次收藏
  • 代码片获得1,205次分享
创作历程
  • 4篇
    2024年
  • 48篇
    2022年
  • 42篇
    2021年
  • 16篇
    2020年
成就勋章
TA的专栏
  • 学习笔记
    45篇
  • 强化学习
    20篇
  • 论文阅读
    8篇
  • LeetCode
    23篇
兴趣领域 设置
  • 人工智能
    机器学习深度学习tensorflow数据分析
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python实现 YOLO中的数据增强|Mixup、Mosaic

Mixup指的是随机在训练集中抽取两类,用线性插值方法将他们混合在一起。假设当前文件夹下共有四张图片。
原创
发布博客 2024.08.07 ·
347 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

BurpSuite中文包改英文版本

这一部分去掉即可换回英文版本。
原创
发布博客 2024.03.14 ·
1439 阅读 ·
10 点赞 ·
0 评论 ·
10 收藏

CTF比赛之BurpSuite教程

【代码】CTF比赛之BurpSuite教程。
原创
发布博客 2024.03.13 ·
595 阅读 ·
5 点赞 ·
1 评论 ·
12 收藏

小白刷题CTF show web方向

CTF show做题笔记
原创
发布博客 2024.03.12 ·
485 阅读 ·
8 点赞 ·
1 评论 ·
5 收藏

服务器出现 conda:command not found如何修复

注意这个地方的path要改成自己的bin目录哦,不能直接复制哦!命令打开,也可以在可视化界面找到对应文件,双击打开。文件,可以在终端使用。
原创
发布博客 2022.09.08 ·
1199 阅读 ·
2 点赞 ·
1 评论 ·
0 收藏

强化学习中的并行方法:ApeX框架 梯度并行,A3C经验并行 | 分布式异步参数更新, 分布式数据生成

有一个主网络和很多的worker。A3C把主网络的参数直接赋予worker中的网络,更新时。该架构依赖于优先记忆重放,只关注actor生成的最重要的数据。强化学习收敛速度慢,采用并行计算可以加快计算速度。与环境进行交互,产生的数据存储在。,对主网络的参数进行更新。
原创
发布博客 2022.08.25 ·
2015 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

pycharm中调试ray,设置断点不跳进去怎么办?解决方法

网上找了一下,在stackflow中发现了这个回答。框架,发现设置了断点后,并不会跳进相应函数。
原创
发布博客 2022.08.24 ·
1129 阅读 ·
7 点赞 ·
3 评论 ·
3 收藏

超详细debug教程!小白必看!百分之八十的人都不知道的debug小技巧;pycharm界面如何设置?pycharm如何debug?for循环时如何停止?各种debug小技巧分享!

如果你是刚上手python的小白,一定要看这篇文章!如果已经用了好几年python,也不要错过这篇文章哦,总有一些小tips是你不知道的。
原创
发布博客 2022.08.19 ·
1527 阅读 ·
9 点赞 ·
0 评论 ·
18 收藏

服务器的CUDA是哪里来的?pytorch会自动安装CUDA吗?如何选择CUDA版本?nvcc --version的版本和nvidia-smi不一样是怎么回事?pytorch无法使用GPU怎么办?

我们安装pytorch的时候,也会顺带安装cuda,那这个cuda和服务器自带的cuda是什么关系呢?另外,安装pytorch的时候,这里的platform究竟是什么意思呢?我问了问之前使用这个命令的同门,他表示:“那个可能过时了,当时好像是3090的原因”。于是上网搜了搜,发现可能是pytorch版本和CUDA版本不一样,于是使用。的时候安装的是什么东西,有没有cuda(千万不要安装成cpu版本哦!命令,惊奇的发现,CUDA version居然是11.4!所以,大家下载pytorch的时候,一定要从。..
原创
发布博客 2022.08.12 ·
4249 阅读 ·
16 点赞 ·
2 评论 ·
44 收藏

找到一个超级神奇,百试百灵的解决 ModuleNotFoundError: No module named xxx 的方法

在pycharm里,将导入不了的文件夹右键设置为source,就可以啦!
原创
发布博客 2022.08.10 ·
330 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

本地导入不报错,服务器端报错 No module named xxx

代码】本地导入不报错,服务器端报错 No module named xxx。
原创
发布博客 2022.08.10 ·
339 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

解决mpi4py导入报错ImportError: libmpi.so.40: cannot open shared object file: No such file or directory

网上找了好久的方法,试了很多都不行。
原创
发布博客 2022.08.09 ·
12227 阅读 ·
10 点赞 ·
5 评论 ·
12 收藏

PRIMAL: Pathfinding via Reinforcement and Imitation Multi-Agent Learning 代码解析

PRIMAL: Pathfinding via Reinforcement and Imitation Multi-Agent Learning 论文代码运行笔记
原创
发布博客 2022.07.28 ·
2448 阅读 ·
6 点赞 ·
10 评论 ·
28 收藏

Unity行人随机行走不碰撞

属性Mass(质量)、Drag(阻力)、AngularDrag(角阻力)、UseGravity(是否使用重力)、IsKinematic(是否受物理影响)、CollisionDetection(碰撞检测)等。比如地面就可以不设置刚体,因为地面是永远不动的,把人物设置刚体就可以实现真实的物理碰撞效果了。将行人对象的Layer设置为相同层级,再调整碰撞矩阵,就会互相不碰撞了。这里的不碰撞并不是“避障”,只是不检测碰撞了。,所以在使用刚体时,根据可能发生的碰撞触发事件,适当的。的游戏对象相互接触的时候。......
原创
发布博客 2022.07.22 ·
1840 阅读 ·
1 点赞 ·
0 评论 ·
15 收藏

无人驾驶动态避障策略调研 | 机器人动态避障策略 | 行人轨迹预测 | 机器人导航

既然要避障,就需要知道周围障碍物的位置和速度,预测是否会相撞。一般分为三个步骤①障碍物检测②障碍物轨迹预测③避障光流传感器可以估计物体的速度轨迹预测,比较简单的方法是基于行人过去的速度和方向,预测下一时刻的位置坐标,判断是否会与机器相撞。..............................
原创
发布博客 2022.07.15 ·
6063 阅读 ·
31 点赞 ·
0 评论 ·
146 收藏

三篇强化学习用于多智能体路径规划的论文

期刊:applied science MDPI总结:使用VGG进行特征提取,再使用DQN进行决策。论文质量较低,缺乏很多重要内容,如:环境搭建、数据集介绍、action和state的相关描述,还有很多typo;而且论文中并未体现出多机器人的思想。论文模型图非常简单,画了跟没画似的。。。和常见的强化学习交互图一样。用到了CNN来处理像素信息(应该后续会作为state),但文中并未说明图像信息来源:reward设置:离目标近,reward +0.2;碰撞,reward -20;到达目标点,reward
原创
发布博客 2022.07.13 ·
8761 阅读 ·
14 点赞 ·
0 评论 ·
128 收藏

强化学习中 on-policy与off-policy 的理解;如何区分on-policy 与 off-policy;RL更新策略、policy结构总结

有趣的解释:古时候,优秀的皇帝都秉持着“水能载舟 亦能覆舟”的思想,希望能多了解民间百姓的生活。皇帝可以选择通过微服出巡,亲自下凡了解百姓生活(On-policy),虽然眼见为实,但毕竟皇帝本人分身乏术,掌握情况不全;因此也可以派多个官员去了解情况,而皇帝本人则躺在酒池肉林里收听百官情报即可(Off-policy)。Q-learning vs. Sarsa二者都是基于TD的强化学习策略,但是前者是off-policy(有目标网络和行为网络),后者是on-policy。on-policy与off-polic
原创
发布博客 2022.07.07 ·
5452 阅读 ·
9 点赞 ·
1 评论 ·
53 收藏

对word2vec的一些浅层理解

最近有朋友问到word2vec是怎么一回事,于是我又复习了一遍相关知识,记录下自己的一些思考,防止遗忘~word2vec是获取词向量的手段,它是在NNLM基础上改进的。训练模型本质上是只具有一个隐含层的神经元网络。它有两种形式 ① skip-gram:从两边预测中间 ② C-BOW:从中间预测两边;注意,这两种形式只是代表两种不同的训练方式,最终都是取输入层->隐藏层的权重,作为词向量。训练时,以CBOW为例,假设语料库是“今天的天气真好”;模型的输入是 "今 天 的 天 真 好"六个单词的one-h
原创
发布博客 2022.07.06 ·
436 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Trajectory planning for multi-robot systems: Methods and applications 综述阅读笔记

本文中Multi-Robot System (MRS) 并不局限于机器人,指代的是UAV和UGV要求:安全到达指定地点,尽量选择短距离、短时间介绍了无人机和自动驾驶:(综述的名字明明是trajectory planning,但是文中全在讲path planning)将环境分解为多个网格,获取环境表示,需要识别哪些地方是起始点、障碍。相当于一张无向图啦那么,问题就变成 找到一条从初始节点到终止节点的路径迪杰斯特拉(Dijkstra)算法是典型最短路径算法,用于计算一个节点到其他节点的最短路径。 它的主要
原创
发布博客 2022.07.06 ·
1005 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

[牛客网刷题 Day6] JZ27 二叉树的镜像

操作给定的二叉树,将其变换为源二叉树的镜像。返回的是一棵树,那得建立TreeNode吧,想到了两种方法:① 使用队列,从右往左存node,这样读出来的顺序就是镜像的;可是答案要求输出一颗树,我不知道怎么转换成树② 使用递归,当孩子为叶节点时,交换左右节点的位置;可是还是写不来,o(╥﹏╥)o偷偷看了答案,用堆栈存储节点,每次取出来就交换左右节点,于是照着这个思路写了一下代码:答案:看了看递归:解题步骤:1、特判:如果pRoot为空,返回空2、交换左右子树3、把pRoot的左子树放到Mirro
原创
发布博客 2022.07.05 ·
235 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多