Mocode-CSDN博客

原创【2026】Datawhale X AMD · Hello ROCm - Part1 - 配置云环境&部署大模型

ROCm（Radeon Open Compute）是AMD公司开发的开源GPU计算平台，类似于NVIDIA的CUDA平台。这篇文章主要介绍怎么利用AMD AI开发者计划提供的AMD显卡资源，在云端AMD显卡上用业界主流的vLLM框架，把Google最新开源的Gemma4跑成可对话的推理服务。

2026-06-12 23:49:09 180

原创 CAMEL-Task2-Agent的构成组件

在CAMEL框架中，agent使用内置工具或自定义工具完成任务的示例说明。

2025-08-23 00:31:38 1330

原创 CAMEL-Task1-CAMEL环境配置及你的第一个Agent

CAMEL环境配置及RolePlaying案例尝试。

2025-08-21 00:10:32 1125

原创【2025】Datawhale AI夏令营-多模态RAG-Task3笔记-解决方案进阶

为了弥补baseline方案中无法利用图表信息的不足，进阶方案中使用MinerU提取PDF中的图文信息，为LLM检索回答提供更细粒度、更丰富、上下文更流畅的知识文本。

2025-08-13 22:28:13 1138

原创【2025】Datawhale AI夏令营-多模态RAG-Task1、Task2笔记-任务理解与Baseline代码解读

以财报问答任务为具体场景，理解多模态RAG问题挑战及解读baseline方案代码。

2025-08-09 23:44:13 1419

原创【Git】同时在本地使用多个github账号进行github仓库管理

本地有多个均需要使用的github账号情况，如：项目A（远程仓库A）使用github账号A、项目B（远程仓库B）使用github账号B，项目A和项目B需要同时推进。此时为了维持两个项目开发的需要，需要在本地频繁切换不同github账号。接下来介绍一个”一劳永逸“的方法，在同时开发两个项目的同时避免在本地频繁切换不同github账号。

2025-07-03 22:59:32 937

原创【云盘】使用阿里云盘托管项目大文件

使用阿里云盘托管在不同服务器上运行项目实验过程中产生的数据、模型等大文件。

2025-05-02 21:57:48 1535

原创【2025】Datawhale AI春训营-蛋白质预测（AI+生命科学）-Task2笔记

c = 'X'nn.GELU(),return xinitial=0,metric / len(valid_dataloader) } ") # 保存当前 epoch 的模型 save_path = f"model.pkl" torch . save(model . state_dict() , save_path) print(f"Model saved to {03d",

2025-04-19 20:59:44 451

原创【2025】Datawhale AI春训营-RNA结构预测（AI+创新药）-Task2笔记

几何特征生成器# 计算连续三个向量# 计算法向量# 计算二面角# 填充处理# 图构建器assert coord.shape[1:] == (7,3), f"坐标维度错误:# 图构建器 class RNAGraphBuilder : @staticmethod def build_graph(coord , seq) : assert coord . shape [ 1 : ] ==(7 , 3) , f"坐标维度错误: {

2025-04-19 20:34:58 597

原创【git】将项目上传到github、gitee

将项目上传到github、gitee的过程。

2024-12-25 18:15:29 1433

原创【强化学习理论】基于策略的强化学习——深度确定性策略梯度算法

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，DDPG）是一种Actor-Critic框架的算法，该算法常用于连续控制任务（动作空间为连续型），其中Actor网络产生的动作是具体的、确定的动作而非动作的分布，因此被称为“确定性”策略梯度。本文介绍深度确定性策略梯度算法。

2024-11-05 01:22:42 2014

原创【强化学习理论】基于策略的强化学习——策略梯度算法

基于策略的强化学习方法通过计算动作分布进行动作选择。策略梯度算法（policy gradient，PG）是经典的基于策略的强化学习方法，本文对策略梯度算法进行介绍。

2024-11-04 17:10:58 1055

原创 Transformer编码器结构及运算过程的符号表示

这篇文章主要是展示Transformer编码器的结构，同时尽量使用数学符号表达编码器的运算过程。Transformer编码器的核心结构是多头注意力机制，本文从（单头）注意力机制开始描述，然后扩展到对编码器运算过程的描述。暂不涉及解码器的描述。

2024-10-24 19:30:16 1391

原创贝叶斯神经网络与变分推断

本文解释了贝叶斯神经网络（Bayes Neural Network, BNN）、变分推断（variational inference, VI）及二者之间的关系。

2024-10-22 23:26:07 2522

原创【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task3

本文是关于李宏毅苹果书”第2章实践方法论“学习内容的记录。

2024-09-03 21:14:50 899

原创【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task2笔记

本文介绍通义实验室最新的多模态手机智能体工作——Mobile-Agent。

2024-08-31 22:04:35 1971

原创【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task2

本文是关于李宏毅苹果书”线性模型“学习内容的记录。

2024-08-31 20:19:54 1144

原创【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task1笔记

Task1主要任务是跑通Mobile-Agent Demo。

2024-08-28 21:57:39 1487

原创【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task1

本文是关于李宏毅苹果书“第1章机器学习基础”学习内容的记录。

2024-08-26 21:19:21 857

原创【PyTorch】安装pytorch方法总结

简单总结了在服务器上安装Pytorch的三种方法，分别是官网指令安装、远程下载包后本地安装以及清华镜像源安装。

2024-08-04 12:47:00 1404

原创【2024】Datawhale AI夏令营 Task4笔记——vllm加速方式修改及llm推理参数调整上分

本文承接前一篇文章，对其中vllm加速方式进行修改，推理速度获得了极大提升。另外，在延用多路投票的同时，通过调整大语言模型的参数获得了一些分数的提升。

2024-08-03 19:37:03 2010

原创【2024】Datawhale AI夏令营 Task3笔记——Baseline2部分代码解读及初步上分思路

本文对可完成赛事“逻辑推理赛道：复杂推理能力评估”初赛的Baseline2部分关键代码进行详细解读，介绍Baseline2涉及的关键技术和初步上分思路。Baseline2代码由Datawhale AI夏令营提供，核心内容是将大语言模型部署至本地，并在此基础上使用Lora技术微调大语言模型。另外，为了加快本地推理的速度，本次任务代码使用vllm技术加速大语言模型推理（Task1和Task2方法的核心是直接调用外部大语言模型的API进行推理）。

2024-08-02 22:24:05 1278

原创【2024】Datawhale AI夏令营 Task2笔记——Baseline代码详细解读

对可完成赛事“逻辑推理赛道：复杂推理能力评估”初赛的baseline代码进行详细解读，该baseline代码由Datawhale AI夏令营提供，核心内容是调用灵积模型服务平台的大语言模型对测试集的题目进行推理。

2024-07-30 22:03:58 1192

原创【2024】Datawhale AI夏令营 Task1

本文对Datawhale提供的对赛事【逻辑推理赛道：复杂推理能力评估】的baseline代码进行解释。

2024-07-28 23:46:59 548

原创在pycharm 2023.2.1中运行由R语言编写的ipynb文件

项目中包含由R语言编写的ipynb文件，希望能在pycharm中运行该ipynb文件。最终未能直接在pycharm中运行该ipynb文件，但是替代的实现方法有：①能够在网页端运行由R语言编写的ipynb文件；②能够将该ipynb文件中的内容复制到一个R语言文件（以.R为后缀）中，然后在pycharm中直接运行该R语言文件。

2024-07-14 11:27:19 2992

原创智谱AI——智能体开发探索

使用智谱AI探索大语言模型智能体开发。

2024-06-08 07:37:37 4412

原创【DL】FocalLoss的PyTorch实现

PyTorch计算FocalLoss的两种方式。

2024-05-10 23:40:20 845

原创【Git】回滚旧提交版本且不影响最新提交版本

需要回滚旧提交版本，但不影响已有的所有提交版本（即不影响最新提交版本），以便需要时可以重新回滚到最新提交版本。

2024-05-06 23:20:02 1983

原创 Linux安装MuJoCo各版本及D4RL教程

Linux安装MuJoCo各版本（150、200、210）及D4RL教程。

2024-04-10 17:36:46 6814 4

原创 LLama大模型初体验——Linux服务器部署LLama注意事项

在Linux服务器部署Llama模型的注意事项。

2023-10-23 15:21:08 3472 1

原创 python多线程线程池的map和starmap对比

map和starmap都是多线程中同步执行的方法，二者的差别在于用map函数放入线程池的任务只能接受一个参数；用starmap函数放入线程池的任务则可以接受多个参数。这样看来，starmap函数其实比map函数更好用。下面是案例分析（注意每个代码段里job函数的参数数量、使用的是map还是starmap）。

2023-08-06 17:59:06 2007