- 博客(62)
- 资源 (4)
- 收藏
- 关注
原创 使用bitNet架构
大型语言模型(LLM)面临的挑战:高能耗、高内存需求、部署门槛高。微软提出 BitNet 架构,旨在实现低功耗、低延迟、高效率的推理。BitNet架构BitNet b1.58 2B4T:首个开源、原生训练的 1-bit LLM,参数量达 20 亿[1]。BitLinear 层:替代传统的 nn.Linear 层,支持三值权重(-1, 0, +1),实现 1.58-bit 精度。( 支持原生1.58bit训练,而不是量化后1.58bit)
2025-05-13 20:49:07
482
原创 服务器-conda下载速度慢-国内源
conda频道中有无效频道导致下载失败阿里云并不维护 Conda 官方 anaconda/pkgs/* 镜像。
2025-04-23 10:03:29
505
原创 服务器配置环境-conda&pytorch_20250422
1.2 激活 Conda 环境将 <environment_name> 替换为你要激活的环境的名称。例如,如果你想激活名为 myenv 的环境:1.3 关闭 Conda 环境二、版本查看CUDA版本检查你的 GPU 驱动版本验证 CUDA 版本当电脑里有多个CUDN时博客:服务器-服务器里有多个CUDA常见的Torch、CUDA和Python版本的对应关系阿里源
2025-04-23 09:46:26
479
原创 20250412_代码笔记_CVRProblemDef
该笔记分析代码的功能是生成随机VRP问题的数据,包含仓库坐标、节点坐标和节点需求。对该代码进行改进20250412-代码改进-拟蒙特卡洛。
2025-04-12 23:03:07
383
原创 20250412-代码改进-拟蒙特卡洛
马尔科夫链蒙特卡罗(MCMC)由于其简单有效性而得到了广泛的应用。在MCMC 中,需要用到独立同分布的随机数样本。经验表明,将拟随机数点列应用 到蒙特卡罗模拟(MC)的拟蒙特卡罗模拟(QMC)能够得到更好的模拟结果,提高 模拟的精度。
2025-04-12 23:02:23
299
原创 20250329-强化学习笔记-DQN
第 7 章 DQN 算法''' 经验回放池 '''self.buffer = collections.deque(maxlen=capacity) # 队列,先进先出def add(self, state, action, reward, next_state, done): # 将数据加入bufferdef sample(self, batch_size): # 从buffer中采样数据,数量为batch_sizedef size(self): # 目前buffer中数据的数量初始化模块 (
2025-03-31 11:01:24
607
原创 20250320-论文学习笔记-POMO: Policy Optimization with Multiple Optima for Reinforcement Learning
NeurIPS 2020 的论文,POMO: Policy Optimization with Multiple Optima for Reinforcement Learning。
2025-03-21 16:43:43
653
原创 20250306-笔记-精读class CVRPEnv:step(self, selected)
函数是强化学习代码实现中的核心。熟悉每一个参数的shape。熟悉每个参数之间的关系(剪切,扩展,等)。
2025-03-07 16:13:18
706
原创 20250304笔记-阅读论文
浏览器扩展-AI Code Finder & Alerts for Papers: CatalyzeX功能显示论文的代码。
2025-03-04 22:35:57
560
原创 20250303-代码笔记-train_n100
DEBUG_MODE: 控制是否启用调试模式。False表示不开启调试模式,True启用调试模式。USE_CUDA: 是否使用 GPU 加速计算,默认值为True,即在非调试模式下使用 CUDA(GPU)。: 指定要使用的 GPU 编号。1表示使用第二个 GPU,0表示使用第一个 GPU。-1表示不使用 GPU。
2025-03-03 15:53:48
640
原创 20250301_代码笔记_函数class CVRPEnv: def step(self, selected)
细读函数selected为step()函数的输入参数。
2025-03-01 15:18:42
775
原创 服务器运行代码-screen
screen使用screen可以极大地提高你在服务器上运行长时间任务的效率。它能够持久化会话、管理多个任务,并且允许你在任务运行时断开并重新连接,避免了 SSH 连接中断的风险。掌握screen的基本操作,你就能够更高效地管理服务器上的任务。
2025-02-28 21:39:26
464
原创 20250225-代码笔记03-class CVRPModel AND other class
学习代码:init 是 CVRPModel 类的构造函数,负责初始化模型的各个组件。主要任务包括:执行流程图链接二、class CVRPModel(nn.Module):pre_forward(self, reset_state)函数功能pre_forward 是 CVRPModel 类的一个前向传播前的准备函数。它的主要任务是根据给定的初始状态(reset_state)准备和编码数据,为模型的后续前向传播(forward)过程做准备。具体来说,函数的作用是:执行流程图链接
2025-02-28 20:24:46
984
原创 20250224-代码笔记02-class CVRPTrainer
代码/home/tang/RL_exa/NCO_code-main/single_objective/LCH-Regret/Regret-POMO/CVRP/POMO/CVRPTrainer.py学习。该代码功能是训练模型。
2025-02-24 20:15:25
626
原创 20250217-学习方法迭代
在通过大量的实践验证下,发现我现有的学习方法效率不高。即学习方法急需进行迭代改进。这周暂且应用这两个方法,记忆宫殿是否是真的?如何将其应用到自己的学习方法中?
2025-02-17 11:01:41
290
原创 20250110_ PyTorch中的张量操作
torch.cat 函数将两个张量拼接起来,具体地是在第三个维度(dim=2)上进行拼接。注:dim取值范围是0~2# shape2# shape若要拼接node_xy 与node_demand 需要将node_demand 进行维度拓展即。
2025-01-10 22:24:13
1133
原创 2025-01-10参数数据结构知识点分析
在程序中常常会看到三维数据,但此三维和常见的三维坐标是不同的表达形式。对于每一个张量形状,从右至左在数据矩阵上可以象形的看作从内至外。
2025-01-10 17:08:53
351
原创 2024/12/26——提问:状态转移概率与决策,贝尔曼方程递归优化策略
问题1:贝尔曼方程递归优化策略,是用来求解最优动作奖励的么?回答:是的,贝尔曼方程的目标是通过递归计算值函数VsV(s)Vs或动作值函数QsaQ(s, a)Qsa,最终找到每个状态下的最优动作以及对应的长期累积奖励。问题2:贝尔曼方程递归优化策略,是迭代出当前时间步的最优动作么?通过当前状态,多次比较不同的动作而比较出一个整体奖励最优的动作么?回答:是的,贝尔曼方程通过对当前状态下所有动作的价值QsaQ(s, a)Qsa进行比较,选择整体奖励最优的动作。
2024-12-26 16:40:11
930
原创 python3.6搭建pytorch环境
是支持 Python 3.6 的最后一个版本。CUDAToolkit 11.1 可以与 PyTorch 1.8.1 搭配使用(前提是你的 GPU 驱动程序支持 CUDA 11.1 或更高版本)。
2024-12-23 22:40:46
936
原创 服务器建立-错误:pyenv环境建立后python版本不对
从你的描述来看,现在 pyenv 能够正确工作,python --version 已经显示为 Python 3.6.9,说明之前的问题已经解决。
2024-12-23 13:11:41
922
原创 再服务器上建立新的编译环境
基于pyenv建立环境配置pyenv_博客阿里资源库提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-12-23 10:25:47
527
原创 笔记-代码分析-CVRP&MDP
二、代码分析——class CVRPEnv(gym.Env)1. def init(self, num_nodes=10, vehicle_capacity=15):
2024-11-01 13:46:33
394
原创 服务器新建用户
环境:为用户设置密码设置密码后,可以尝试使用 su 切换到 tang 用户,确保该用户可以正常使用:二、问题问题一、没有那个文件或目录**办法:**动创建主目录 可以使用 命令手动创建主目录,并确保该目录的所有权属于 tang(用户名)用户:
2024-10-29 15:40:21
1248
原创 笔记-配置PyTorch(CUDA 12.2)
如果还没有创建环境,可以先创建:2. 安装 PyTorch(CUDA 12.2)3. 安装 torch_geometric 及依赖项使用 官方提供的临时源命令,结合 Aliyun 镜像:
2024-10-28 22:34:08
3200
原创 VRP_用MDP建模_用SB3改进-未完
VRP_用MDP建模_20241015图结构(Graph Structure)_笔记该代码展示了如何使用DQN 算法解决VRP 问题自定义 Gymnasium 环境模拟了 VRP。DQN 算法通过经验回放和目标网络更新来优化路径选择。训练完成后,模型可以保存并用于测试。使用 DQN 解决 VRP 是组合优化问题在强化学习中的典型应用。通过合理调整超参数(如学习率、探索率),该方法可用于更大规模的调度和物流问题。
2024-10-19 12:04:47
846
原创 图结构(Graph Structure)_笔记
图结构的详细描述图(Graph)是数学和计算机科学中用于描述对象集合及其相互关系的抽象模型。它由一组顶点(Vertices)和连接这些顶点的边(Edges)组成。图结构广泛应用于网络分析、路径规划、社交网络、数据挖掘等领域。一、图的基本概念顶点(Vertex):表示对象或实体,通常用集合VVV表示。边(Edge):表示顶点之间的连接关系,通常用集合EEE表示。无向边:没有方向性,连接的两个顶点关系对等。有向边(弧):具有方向性,表示从一个顶点指向另一个顶点的关系。二、图的分类按边的方向性。
2024-10-16 15:45:39
2609
原创 第 4 章 动态规划算法_未完待续
第 4 章 动态规划算法提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-10-15 20:22:55
829
串口助手.rar
2019-08-19
MFC8848.rar
2019-08-19
Tang01.rar
2019-08-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人