Simon#0209-CSDN博客

原创学习日志38-cpelx求解器使用

摘要本文介绍了如何在CPLEX中使用分段线性函数来优化目标函数，具体应用于拆卸线平衡问题。模型的目标是最大化拆卸净收益，即组件回收价值减去拆卸成本。通过定义组件参数、任务参数、质量影响参数等，模型考虑了组件的市场价格、初始质量系数、拆卸时间和成本等因素。目标函数中使用了分段线性函数来计算组件的回收收益，并结合拆卸成本进行优化。模型还包含多个约束条件，如工作站启用状态、任务分配、优先关系、冲突任务处理等，以确保拆卸过程的合理性和效率。最后，模型通过求解器配置和结果输出模块，提供了详细的组件价值贡献和被拆除组

2025-05-16 15:47:04 292

原创学习日志37—基于变分量子电路的量子机器学习算法综述

这篇文章全面综述了基于变分量子电路的量子机器学习算法的研究现状和进展，指出了其在分类、生成、强化学习等任务中的优势，同时也分析了当前面临的挑战和未来的研究方向。随着量子硬件和算法的不断进步，变分量子算法有望在量子机器学习领域实现突破，成为智能系统的重要组成部分。

2025-04-08 20:55:17 830

原创学习日志36

拆卸可定义为将产品分离成其组成部件、组件、子组件或其他分组的系统方法。虽然拆卸操作可以在单个工作站、拆卸单元或拆卸线上进行，但最高的吞吐量和生产率是由拆卸线提供的。在文献中，拆卸操作和生产线中出现了许多子问题，如拆卸计划、拆卸调度、拆卸排序和拆卸线平衡(DLB)DLB问题在一定程度上与装配线平衡(ALB)有关，近年来一直吸引着逆向物流领域的兴趣。尽管将拆卸视为组装的反面可能听起来很合理，但对于复杂产品，拆卸和组装的操作特性是完全不同的。

2024-10-10 00:01:30 1165 2

原创学习日志35

这类问题的核心目标是在确保拆解过程符合环境和安全要求的同时，最大化资源回收的价值，同时考虑拆解成本和效率。在实际操作中，可能需要考虑更多的变量，如工人的可用性、工具的维护和更换、以及不同任务之间的复杂依赖关系。在这个例子中，HDLBP的目标是确定如何在混合拆解线上分配台式电脑和笔记本电脑的拆解任务，以便在满足所有约束的同时最大化利润。混合拆卸线问题是DLBP的一个扩展，它结合了不同类型的拆解线，如线性拆解线和U形拆解线，以适应更广泛的产品种类和拆解需求。利润取决于拆解任务的完成速度和拆解部件的市场价值。

2024-10-08 22:54:31 927

原创学习日志34

量子计算与冰湖问题：探索量子强化学习的前沿

2024-09-04 22:28:13 186

原创学习日志33

量子线路，也称量子逻辑电路是最常用的通用量子计算模型，表示在抽象概念下，对于量子比特进行操作的线路。当然了最重要的一点我觉得还是时间线。在不同的时间完成相同的事情，效果往往有很大的差别，这一点大家应该都能理解，毕竟先做饭才能后吃饭，要是先吃饭后做饭，我想到了一种可能性：这人在减肥，先喝了一顿西北风，然后做饭当成宠物饲料。不同于传统电路是用金属线所连接以传递电压讯号或电流讯号，在量子线路中，线路是由时间所连接，亦即量子比特的状态随着时间自然演化，过程中是按照哈密顿运算符的指示，一直到遇上逻辑门而被操作。

2024-09-03 22:53:19 583

原创学习日志32

创建量子线路及其可视化。打印量子态的分布代码。

2024-09-01 21:53:35 263

原创学习日志31

真实量子计算机演示出现问题，暂时没有使用权限，目前需要将原有代码改造为本源量子计算平台代码。使用虚拟量子计算服务进行测试目前情形良好，输出正常，但是测量电路的搭建略显抽象。本源量子计算平台体验。

2024-08-31 22:26:20 274

原创学习日志30

文章首先介绍了开放量子系统理论的重要性，它不仅有助于描述量子系统的非平衡特性，还为量子测量问题提供了理论框架，并且为研究噪声对量子技术有害影响提供了工具。随着对量子系统的控制能力不断增强，以及在复杂生物系统中发现量子相干性，许多场景中马尔可夫假设的不足开始显现，这促进了对记忆效应和非马尔可夫动力学特性的研究。在量子通信领域，文章探讨了量子信道容量和量子信息传输的非马尔可夫特性。文章总结了IBM Q Experience在模拟开放量子系统方面的多功能性和有效性，并强调了其在量子物理和量子技术研究中的潜力。

2024-08-30 21:25:07 666

原创学习日志29

引言部分首先介绍了开放量子系统的理论研究的重要性，这些理论描述了量子系统与其环境相互作用的动力学。在过去的十年中，多个实验成功地模拟了不同平台上的开放量子系统，包括线性光学、离子阱、核磁共振（NMR）和腔量子电动力学。例如，作者如何构建量子电路来模拟特定的开放量子系统模型，他们如何通过量子态层析来验证电路的输出，以及他们如何使用Qiskit的错误缓解工具来提高实验的准确性。他们设计了实验来验证量子信道容量的非单调行为，并展示了记忆效应如何影响量子系统的动力学。实验的执行过程，包括量子电路的编译和运行。

2024-08-29 22:21:20 620

原创学习日志28

量子计算是一种利用量子比特（Qubits）进行计算的技术，它能够实现量子叠加和量子纠缠，从而在某些任务上提供超越经典计算的潜力。将量子计算应用于强化学习，可以创建量子强化学习模型，其中智能体和环境的状态可以表示为量子态，它们的交互可以通过量子通道进行。量子加速源于量子计算的两个关键特性：量子叠加和量子纠缠。量子强化学习可以应用于量子游戏和复杂的优化问题，如量子控制和量子系统的模拟。量子强化学习是量子机器学习的一个重要分支，它可以用于设计更高效的量子算法，以解决机器学习中的挑战性问题，如特征选择和模型优化。

2024-08-27 22:10:54 648

原创学习日志27

对昨天的代码做出更新，对版本不对导致的错误进行优化，目前代码可以正常运行。

2024-08-24 22:07:54 335

原创学习日志26

这段代码是一个使用量子神经网络（QNN）和深度Q网络（DQN）算法来解决强化学习任务的完整实现。：使用gym库创建和配置强化学习环境。：用于存储状态、动作、奖励、下一个状态和完成标志的转换，并从中随机采样。：定义了一个量子神经网络，包括数据编码、量子层和测量。：实现了深度Q网络算法，包括动作选择、参数更新和目标网络的同步。：在环境中运行多个episodes，收集数据，更新网络参数，并保存结果。：将训练过程中的回报写入文件，并提供了一个读取文件的函数。

2024-08-23 22:19:12 2095

原创学习日志25

状态在决策步骤t的状态st是一个析取图G（t）=（O，C Du（t），D（t）），表示解的当前状态，其中Du（t）D包含所有在t之前被分配了方向的（有向）析取弧，D（t）D包含剩余的析取弧。对于工件Ji的非调度操作Oij，我们递归地计算该下界为CLB（Oij，st）= CLB（Oi，j−1，st）+ pij，只考虑来自其前一个的优先约束，即Oi，j−1 → Oij，并且如果Oij是Ji的第一个操作，其中ri是Ji的释放时间，则CLB（Oij，st）= ri + pij。：从状态到行动的映射，表示为。

2024-08-21 20:39:53 646

原创学习日志24

解决FJSP的方法多种多样，包括传统的启发式和元启发式算法，以及基于人工智能的方法，如遗传算法（Genetic Algorithm, GA）。实际应用中，FJSP的求解过程需要考虑多种约束条件，如每台机器在同一时间只能加工一个工件，同一工件的工序顺序不能违背，以及所有工件的工序总时间不能超过最大完工时间等。这些约束条件确保了调度解的可行性和优化目标的实现。综上所述，柔性车间调度问题是一个多目标、多约束的优化问题，其解决方案需要综合考虑工序的加工顺序和机器的选择，以实现生产效率的最大化和成本的最小化。

2024-08-20 08:55:13 402

原创学习日志23

这段代码是一个深度Q学习（Deep Q-Learning, DQN）的实现，它使用变分量子电路作为Q函数的近似器。代码的目的是训练一个智能体在OpenAI Gym中的“Deterministic-ShortestPath-4x4-FrozenLake-v0”环境中导航，以找到从起点到终点的最短路径。整体上，这段代码展示了如何将量子计算与深度强化学习结合起来，通过变分量子电路来近似Q函数，并在经典环境中进行训练和测试。这种方法可能为解决一些传统方法难以处理的复杂问题提供了新的思路。

2024-08-17 23:30:07 269

原创学习日志22

前向传播：根据当前状态生成量子电路，并应用参数theta进行量子旋转。训练量子Q网络 (train_quantum_qnetwork 函数)创建一个量子电路，为每个量子比特应用Hadamard门，实现叠加态。根据量子Q网络生成的量子电路和测量结果，评估每个可能动作的Q值。目前存在的问题，代码具有一定的bug，量子电路的建没有理论支撑。根据训练后的量子Q网络的参数theta，解码出最优策略。执行动作：根据选择的动作（物品）更新背包的容量和状态。初始化：定义网络的量子比特数量和可训练参数theta。

2024-08-14 22:15:20 276

原创学习日志21

量子强化Q-learning通过对量子电路参数的改变，达到同Q表同样的效果，测试结果在较小的数据规模下优于传统强化学习，但是量子电路的设计原理目前并不清晰。对比强化Q-learning学习和量子强化Q-learning学习解决背包问题代码。测试过程中，具有一定的不稳定性，在一些测试中表现出寻找不到最优解的问题。通过对Q表的不断优化，改进，训练完成后，对Q表进行解码，寻找到最优解。设计上应该有一些问题，等待后续的改进探查。

2024-08-12 21:46:48 210

原创学习日志20

新版qiskit不支持，将其改为。关于qiskit使用中的问题。execute引入失败。

2024-08-07 23:58:58 204

原创学习日志19

【代码】学习日志19。

2024-07-30 23:28:09 245

原创学习日志18

关于强化Q学习迷宫问题的示范代码，包含了强化学习核心逻辑。

2024-07-21 23:16:17 201

原创学习日志17

用于组合优化的强化学习:综述。

2024-07-18 23:32:38 1343

原创学习日志16

状态(作用)集可以用量子叠加态表示，本征态(本征作用)可以根据量子测量的坍缩假设随机观察模拟的量子态得到。分析了QRL的收敛性、最优性以及探索和利用之间的平衡等相关特性，表明该方法利用概率幅值很好地权衡了探索和利用之间的关系，并通过量子并行性加快了学习速度。如果将变换U应用于叠加态，则变换将作用于该态的所有基向量，输出将是通过叠加所有基向量的结果而获得的新的叠加态。就像传统的强化学习一样，量子强化学习系统也可以被识别为三个主要的子元素:一个策略，一个奖励函数和个环境模型(可能不明确)。

2024-07-16 23:01:24 154

原创学习日志15

使用强化学习的方法,可以让算法自动学习最优的解决策略,而不需要人工设计状态转移方程。01背包问题属于组合优化问题。

2024-07-10 23:13:27 287

原创学习日志14

今日份任务：查找量子强化学习01背包问题相关论文。强化学习解决01背包问题。关于01背包问题介绍。

2024-07-08 23:44:17 182

原创学习日志13

【代码】学习日志13。

2024-07-06 18:22:34 161

原创学习日志12

总的来说,这段注释描述了这个实现的一些关键特点,包括使用量子机器学习作为Q函数的近似器,采用计算基编码表示状态,使用softmax输出动作概率,以及结合深度Q学习、经验回放和目标网络等技术。第二个环境命名为’Deterministic-ShortestPath-4x4-FrozenLake-v0’,使用了一个名为’ShortestPathFrozenLake’的自定义环境作为入口点,同样设置了4x4的地图大小和确定性的环境。通过多轮次的测试,可以得到代理的平均奖励和平均步数,从而评估其在给定任务上的表现。

2024-07-03 23:26:49 639

原创学习日志10

实现该算法的逻辑为SARSA算法。通过对Q值表的不断更新最终选择出最优解。

2024-07-01 23:23:00 189

原创学习日志9

CNOT门用于纠缠来自每个量子位的量子态，R(α， β， γ)表示具有三个参数的一般单量子位酉门。请注意，量子位的数量可以调整以适应感兴趣的问题，分组框可能会重复几次以增加参数的数量，这取决于用于实验的量子机器的容量和能力。振幅的平方cq1,…有4 ×4 = 16种可能的状态，我们用0到15范围内的整数来标记每种可能的状态。其受到以智能体观察到的标记为11的状态控制，通过这个0-15的值控制旋转门中的值。量子电路在冰冻湖问题中的设计如图，通过对该量子电路的参数不断的优化以达到强化学习中Q 值函数的作用。

2024-06-30 23:08:23 399

原创学习日志8

VQA的一个重要方面是将问题编码为损失函数。类似于经典的机器学习，损失函数将可训练参数θ的值映射到实数，优化任务是找到损失函数的全局最小值式中，U(θ)是参数化的酉，θ由离散和连续的参数组成，是训练集的输入状态，是一组可观察值，fk是编码任务的函数。对于一个给定的问题，可以有不同的fk选择。因C(θ)的最小值对应于问题的解，损失必须是可信的；在量子计算机上进行测量并可能进行经典后处理，从而来有效地估算C(θ)。这里隐含的假设是，损失不能用经典计算机有效地计算，因为这将意味着VQA不能实现量子优势。

2024-06-29 23:47:00 1804

原创学习日志7

深度Q网络算法（Deep Q-Network, DQN）是一种融合了深度学习和强化学习的方法，用于解决强化学习中的值函数近似问题。DQN是由DeepMind在2013年提出的，通过使用深度神经网络作为值函数的函数逼近器，能够处理高维、复杂的状态空间。深度Q网络算法在解决许多强化学习问题中取得了显著的成功，包括Atari游戏和机器人控制等领域。它通过结合深度学习和强化学习的优势，使得智能体能够处理高维、复杂的状态空间，并学习到高质量的决策策略。

2024-06-27 22:10:52 514

原创学习日志6

当前最先进的机器学习方法基于经典冯·诺伊曼计算架构，并在许多工业和学术领域得到广泛应用。随着量子计算的发展，研究人员和技术巨头们试图为机器学习任务设计新的量子电路。然而，由于深度量子电路的不可模拟性，现有的量子计算平台很难模拟经典深度学习模型或问题。因此，有必要为噪声中等规模量子 (NISQ) 设备设计可行的量子算法。这项工作探索了深度强化学习中的变分量子电路。具体来说，我们将经典深度强化学习算法（如经验重放和目标网络）重塑为变分量子电路的表示。

2024-06-25 23:21:06 740

原创学习日志5

相转变门（Phase-shift gate）是量子计算中的一种门操作，用于改变量子比特的相位。相位是量子比特的一个重要特性，它决定了比特在测量时的概率分布。不论是在经典计算还是量子计算中，两量子比特门无疑是建立量子比特之间联系的最重要桥梁。由于低位比特为控制比特，高位比特为目标比特，所以当低位比特位置对应为 1 时，高位比特就会被取反；相转变门的作用是根据输入比特的相位，对输出比特的相位进行相应的调整。门的图标中，含实点的路线对应的量子比特称为控制比特（，其特殊的是，控制相位门里交换控制比特和目标比特的。

2024-06-23 23:17:09 333

xiao1wang15的博客