kuki&&yuki-CSDN博客

原创动态BN介绍与实现：

已知小批量上的数据分布并不能反映全体样本，因此使用小批量上的数据标准化会引入和批量有关的噪声，该噪声也会导致数据发生偏移。在介绍动态BN前，首先我们需要熟悉在pytorch中BN的具体操作，虽然公式很简单，不就是减去输出数据的均值除以输出数据的方差吗，一行BatchNorm1d/2d/3d就解决了。在测试阶段我们不再使用小批量上的统计量，而是使用在训练时估计的全局统计量对每层的数据分布进行标准化。随着训练的进行，每个K个epoch，我们会衰减BN的动量。训练和测试阶段的BN不一样！

2025-06-23 23:06:31 358

原创点云网络基石：速看pointnet/pointnet++

输出大小与MSG相同。pointnet++在此基础上使用了分层结构，分层处理度量空间(欧式距离空间)的一组采样点，首先通过基础的空间距离度量方式将点集划分为重叠的局部区域，随后从小邻域中提取局部特征，这些局部特征随后被组合进一个更大的单元，并再次处理以产生更高层次的特征，持续这个过程直到得到整个点集的全局特征。输出一个大小为N'*K*(d+C)的点集组，每一组N'代表一个局部区域，K是质心点的邻域点数，K在不同的组中是不同的，但是pointnet层能够将不同数量的点转换为固定长度的局部区域特征向量。

2025-06-06 22:50:37 731

原创自监督强化学习重要技巧：Loss is its own Reward:Self-Supervision for Reinforcement Learning(ICLR 2017)

这篇论文是OpenAI在2017年发布在ICLR上的一种自监督强化学习实现方案，时至今日，任有不少强化学习方案依然沿用该技巧。其简单性，有效性，直观性令人叹为观止，由于现在大部分博客介绍的SSL-RL方法集中为CPC,RND之流，这篇好文确鲜有人解析，因此今日再此一叙。从某种角度上讲，自监督强化学习本质上完成了一个奖励自适应的工作，减少了学习过程中人为参与的部分，增加了自动学习环境特征的能力。一、简要介绍：在传统的强化学习中，我们解决的本质上是两个问题：一是对目标策略的优化问题，二是对特征表征学习的问题。所

2025-06-04 16:08:25 1210

原创 AE 与 VAE 深度解析：

因此，我们使用重参数化技巧(参考SAC中对重参数化的说明，简单来说就是因为编码器解码器是同时训练的，但是采样的向量既不是mu也不是sigma的函数，但又由两者确定，即为了可微使用的一种技巧)来模拟采样过程，这使得错误能够通过网络传播。可能会感觉有些奇怪，对于AE来说，深层网络的特征通道反而更少了，这是由其使用场景决定的，我们需要使用尽可能少的通道表示高维输入的潜在特征。可能会感觉有些奇怪，对于AE来说，深层网络的特征通道反而更少了，这是由其使用场景决定的，我们需要使用尽可能少的通道表示高维输入的潜在特征。

2025-06-03 10:50:02 1032

原创 Soft Actor-Critic(SAC)深度解析

这是因为SAC策略网络的输出高斯分布的均值和方差，直接从其输出采样动作会使策略更新的梯度计算不可导，这是因为我们采样的动作at与策略网络中的参数phi相关，但是采样的返回是一个具体值，在at和网络参数phi之间没有明确的可微映射，这就导致梯度是不可计算的，为了解决这个问题我们使用了重参数化的技巧。对于Q网络的更新，这里关注到我们使用了两个不同的Q网络，目的是解决对Q值的过度估计问题，但这里处理过度估计的方法和Double DQN不同，这里我们取Q值估计中的较小值，直接砍掉可能出现过度估计的Q值噪声估计。

2025-05-28 22:42:04 1105

m0_55324065的博客

原创动态BN介绍与实现：

原创点云网络基石：速看pointnet/pointnet++

原创自监督强化学习重要技巧：Loss is its own Reward:Self-Supervision for Reinforcement Learning(ICLR 2017)

原创 AE 与 VAE 深度解析：

原创 Soft Actor-Critic(SAC)深度解析

原创 GYM 0.21.0安装踩坑(修改源码)

原创无法正常启动joint_state_publisher_gui/joint_state_publisher的解决方案

原创优先队列式分枝限界算法求解01背包问题

原创使用selenium突破QQ小说动态cookie,爬取并清洗大批量中文文本(Linux环境)

原创简析一下python中的深浅拷贝和赋值

原创 Win11的Bitlocker位置

原创 ROS服务通信作业（IDE为vscode，系统为Ubuntu18.04,通信内容为随机数排序）

空空如也

空空如也