自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 学习日志18

关于强化Q学习迷宫问题的示范代码,包含了强化学习核心逻辑。

2024-07-21 23:16:17 142

原创 学习日志17

用于组合优化的强化学习:综述。

2024-07-18 23:32:38 810

原创 学习日志16

状态(作用)集可以用量子叠加态表示,本征态(本征作用)可以根据量子测量的坍缩假设随机观察模拟的量子态得到。分析了QRL的收敛性、最优性以及探索和利用之间的平衡等相关特性,表明该方法利用概率幅值很好地权衡了探索和利用之间的关系,并通过量子并行性加快了学习速度。如果将变换U应用于叠加态,则变换将作用于该态的所有基向量,输出将是通过叠加所有基向量的结果而获得的新的叠加态。就像传统的强化学习一样,量子强化学习系统也可以被识别为三个主要的子元素:一个策略,一个奖励函数和个环境模型(可能不明确)。

2024-07-16 23:01:24 113

原创 学习日志15

使用强化学习的方法,可以让算法自动学习最优的解决策略,而不需要人工设计状态转移方程。01背包问题属于组合优化问题。

2024-07-10 23:13:27 256

原创 学习日志14

今日份任务:查找量子强化学习01背包问题相关论文。强化学习解决01背包问题。关于01背包问题介绍。

2024-07-08 23:44:17 153

原创 学习日志13

【代码】学习日志13。

2024-07-06 18:22:34 113

原创 学习日志12

总的来说,这段注释描述了这个实现的一些关键特点,包括使用量子机器学习作为Q函数的近似器,采用计算基编码表示状态,使用softmax输出动作概率,以及结合深度Q学习、经验回放和目标网络等技术。第二个环境命名为’Deterministic-ShortestPath-4x4-FrozenLake-v0’,使用了一个名为’ShortestPathFrozenLake’的自定义环境作为入口点,同样设置了4x4的地图大小和确定性的环境。通过多轮次的测试,可以得到代理的平均奖励和平均步数,从而评估其在给定任务上的表现。

2024-07-03 23:26:49 567

原创 学习日志10

实现该算法的逻辑为SARSA算法。通过对Q值表的不断更新最终选择出最优解。

2024-07-01 23:23:00 161

原创 学习日志9

CNOT门用于纠缠来自每个量子位的量子态,R(α, β, γ)表示具有三个参数的一般单量子位酉门。请注意,量子位的数量可以调整以适应感兴趣的问题,分组框可能会重复几次以增加参数的数量,这取决于用于实验的量子机器的容量和能力。振幅的平方cq1,…有4 ×4 = 16种可能的状态,我们用0到15范围内的整数来标记每种可能的状态。其受到以智能体观察到的标记为11的状态控制,通过这个0-15的值控制旋转门中的值。量子电路在冰冻湖问题中的设计如图,通过对该量子电路的参数不断的优化以达到强化学习中Q 值函数的作用。

2024-06-30 23:08:23 346

原创 学习日志8

VQA的一个重要方面是将问题编码为损失函数。类似于经典的机器学习,损失函数将可训练参数θ的值映射到实数,优化任务是找到损失函数的全局最小值式中,U(θ)是参数化的酉,θ由离散和连续的参数组成,是训练集的输入状态,是一组可观察值,fk是编码任务的函数。对于一个给定的问题,可以有不同的fk选择。因C(θ)的最小值对应于问题的解,损失必须是可信的;在量子计算机上进行测量并可能进行经典后处理,从而来有效地估算C(θ)。这里隐含的假设是,损失不能用经典计算机有效地计算,因为这将意味着VQA不能实现量子优势。

2024-06-29 23:47:00 696

原创 学习日志7

深度Q网络算法(Deep Q-Network, DQN)是一种融合了深度学习和强化学习的方法,用于解决强化学习中的值函数近似问题。DQN是由DeepMind在2013年提出的,通过使用深度神经网络作为值函数的函数逼近器,能够处理高维、复杂的状态空间。深度Q网络算法在解决许多强化学习问题中取得了显著的成功,包括Atari游戏和机器人控制等领域。它通过结合深度学习和强化学习的优势,使得智能体能够处理高维、复杂的状态空间,并学习到高质量的决策策略。

2024-06-27 22:10:52 485

原创 学习日志6

当前最先进的机器学习方法基于经典冯·诺伊曼计算架构,并在许多工业和学术领域得到广泛应用。随着量子计算的发展,研究人员和技术巨头们试图为机器学习任务设计新的量子电路。然而,由于深度量子电路的不可模拟性,现有的量子计算平台很难模拟经典深度学习模型或问题。因此,有必要为噪声中等规模量子 (NISQ) 设备设计可行的量子算法。这项工作探索了深度强化学习中的变分量子电路。具体来说,我们将经典深度强化学习算法(如经验重放和目标网络)重塑为变分量子电路的表示。

2024-06-25 23:21:06 583

原创 学习日志5

相转变门(Phase-shift gate)是量子计算中的一种门操作,用于改变量子比特的相位。相位是量子比特的一个重要特性,它决定了比特在测量时的概率分布。不论是在经典计算还是量子计算中,两量子比特门无疑是建立量子比特之间联系的最重要桥梁。由于低位比特为控制比特,高位比特为目标比特,所以当低位比特位置对应为 1 时,高位比特就会被取反;相转变门的作用是根据输入比特的相位,对输出比特的相位进行相应的调整。门的图标中,含实点的路线对应的量子比特称为控制比特(,其特殊的是,控制相位门里交换控制比特和目标比特的。

2024-06-23 23:17:09 244

原创 学习日记4

量子计算

2024-06-22 21:15:39 396

原创 学习日志2

【代码】学习日志2。

2024-04-27 18:13:38 102

转载 学习日志1

关于量子计算框架的学习。

2024-04-25 20:24:28 18 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除