自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 问答 (1)
  • 收藏
  • 关注

原创 【云盘】使用阿里云盘托管项目大文件

使用阿里云盘托管在不同服务器上运行项目实验过程中产生的数据、模型等大文件。

2025-05-02 21:57:48 1194

原创 【2025】Datawhale AI春训营-蛋白质预测(AI+生命科学)-Task2笔记

c = 'X'nn.GELU(),return xinitial=0,metric / len(valid_dataloader) } ") # 保存当前 epoch 的模型 save_path = f"model.pkl" torch . save(model . state_dict() , save_path) print(f"Model saved to {03d",

2025-04-19 20:59:44 339

原创 【2025】Datawhale AI春训营-RNA结构预测(AI+创新药)-Task2笔记

几何特征生成器# 计算连续三个向量# 计算法向量# 计算二面角# 填充处理# 图构建器assert coord.shape[1:] == (7,3), f"坐标维度错误:# 图构建器 class RNAGraphBuilder : @staticmethod def build_graph(coord , seq) : assert coord . shape [ 1 : ] ==(7 , 3) , f"坐标维度错误: {

2025-04-19 20:34:58 504

原创 【git】将项目上传到github、gitee

将项目上传到github、gitee的过程。

2024-12-25 18:15:29 1239

原创 【强化学习理论】基于策略的强化学习——深度确定性策略梯度算法

深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)是一种Actor-Critic框架的算法,该算法常用于连续控制任务(动作空间为连续型),其中Actor网络产生的动作是具体的、确定的动作而非动作的分布,因此被称为“确定性”策略梯度。本文介绍深度确定性策略梯度算法。

2024-11-05 01:22:42 1459

原创 【强化学习理论】基于策略的强化学习——策略梯度算法

基于策略的强化学习方法通过计算动作分布进行动作选择。策略梯度算法(policy gradient,PG)是经典的基于策略的强化学习方法,本文对策略梯度算法进行介绍。

2024-11-04 17:10:58 740

原创 Transformer编码器结构及运算过程的符号表示

这篇文章主要是展示Transformer编码器的结构,同时尽量使用数学符号表达编码器的运算过程。Transformer编码器的核心结构是多头注意力机制,本文从(单头)注意力机制开始描述,然后扩展到对编码器运算过程的描述。暂不涉及解码器的描述。

2024-10-24 19:30:16 1122

原创 贝叶斯神经网络与变分推断

本文解释了贝叶斯神经网络(Bayes Neural Network, BNN)、变分推断(variational inference, VI)及二者之间的关系。

2024-10-22 23:26:07 1597

原创 【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task3

本文是关于李宏毅苹果书”第2章 实践方法论“学习内容的记录。

2024-09-03 21:14:50 759

原创 【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task2笔记

本文介绍通义实验室最新的多模态手机智能体工作——Mobile-Agent。

2024-08-31 22:04:35 1716

原创 【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task2

本文是关于李宏毅苹果书”线性模型“学习内容的记录。

2024-08-31 20:19:54 1084

原创 【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task1笔记

Task1主要任务是跑通Mobile-Agent Demo。

2024-08-28 21:57:39 1171

原创 【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task1

本文是关于李宏毅苹果书“第1章 机器学习基础”学习内容的记录。

2024-08-26 21:19:21 760

原创 【PyTorch】安装pytorch方法总结

简单总结了在服务器上安装Pytorch的三种方法,分别是官网指令安装、远程下载包后本地安装以及清华镜像源安装。

2024-08-04 12:47:00 789

原创 【2024】Datawhale AI夏令营 Task4笔记——vllm加速方式修改及llm推理参数调整上分

本文承接前一篇文章,对其中vllm加速方式进行修改,推理速度获得了极大提升。另外,在延用多路投票的同时,通过调整大语言模型的参数获得了一些分数的提升。

2024-08-03 19:37:03 1460

原创 【2024】Datawhale AI夏令营 Task3笔记——Baseline2部分代码解读及初步上分思路

本文对可完成赛事“逻辑推理赛道:复杂推理能力评估”初赛的Baseline2部分关键代码进行详细解读,介绍Baseline2涉及的关键技术和初步上分思路。Baseline2代码由Datawhale AI夏令营提供,核心内容是将大语言模型部署至本地,并在此基础上使用Lora技术微调大语言模型。另外,为了加快本地推理的速度,本次任务代码使用vllm技术加速大语言模型推理(Task1和Task2方法的核心是直接调用外部大语言模型的API进行推理)。

2024-08-02 22:24:05 1024

原创 【2024】Datawhale AI夏令营 Task2笔记——Baseline代码详细解读

对可完成赛事“逻辑推理赛道:复杂推理能力评估”初赛的baseline代码进行详细解读,该baseline代码由Datawhale AI夏令营提供,核心内容是调用灵积模型服务平台的大语言模型对测试集的题目进行推理。

2024-07-30 22:03:58 912

原创 【2024】Datawhale AI夏令营 Task1

本文对Datawhale提供的对赛事【逻辑推理赛道:复杂推理能力评估】的baseline代码进行解释。

2024-07-28 23:46:59 412

原创 在pycharm 2023.2.1中运行由R语言编写的ipynb文件

项目中包含由R语言编写的ipynb文件,希望能在pycharm中运行该ipynb文件。最终未能直接在pycharm中运行该ipynb文件,但是替代的实现方法有:①能够在网页端运行由R语言编写的ipynb文件;②能够将该ipynb文件中的内容复制到一个R语言文件(以.R为后缀)中,然后在pycharm中直接运行该R语言文件。

2024-07-14 11:27:19 2450

原创 智谱AI——智能体开发探索

使用智谱AI探索大语言模型智能体开发。

2024-06-08 07:37:37 2769

原创 【DL】FocalLoss的PyTorch实现

PyTorch计算FocalLoss的两种方式。

2024-05-10 23:40:20 587

原创 【Git】回滚旧提交版本且不影响最新提交版本

需要回滚旧提交版本,但不影响已有的所有提交版本(即不影响最新提交版本),以便需要时可以重新回滚到最新提交版本。

2024-05-06 23:20:02 1391

原创 Linux安装MuJoCo各版本及D4RL教程

Linux安装MuJoCo各版本(150、200、210)及D4RL教程。

2024-04-10 17:36:46 4860 4

原创 LLama大模型初体验——Linux服务器部署LLama注意事项

在Linux服务器部署Llama模型的注意事项。

2023-10-23 15:21:08 3181 1

原创 python多线程线程池的map和starmap对比

map和starmap都是多线程中同步执行的方法,二者的差别在于用map函数放入线程池的任务只能接受一个参数;用starmap函数放入线程池的任务则可以接受多个参数。这样看来,starmap函数其实比map函数更好用。下面是案例分析(注意每个代码段里job函数的参数数量、使用的是map还是starmap)。

2023-08-06 17:59:06 1646

原创 【Pytorch】神经网络模型保存与加载

使用pytorch保存、加载神经网络模型的2种方法。

2023-06-18 12:08:12 938

原创 【强化学习理论】贝尔曼最优方程公式推导

继贝尔曼期望方程之后,对贝尔曼最优方程的公式推导。结合图文更好理解。

2023-06-12 01:11:07 1076

原创 【PyTorch】Torch.gather()用法详细图文解释

Torch.gather()用法的详细图文解释,通过比喻理解。

2023-06-05 00:16:11 14488 2

原创 【MIMICIII 数据库安装】踩坑记录+解决方案

在安装MIMIC III数据库过程中踩到的坑与解决方案记录。

2023-05-25 17:29:12 6534 31

原创 【强化学习理论】时序差分算法

关于时序差分算法两种代表方法(Sarsa和Q-learning)的异同,延伸到在线策略和离线策略学习方法的异同。

2023-05-23 16:29:48 473

原创 【强化学习理论】动态规划算法

关于动态规划算法两种代表方法的对比总结。

2023-05-10 00:00:17 206

原创 【强化学习理论】状态价值函数与动作价值函数系列公式推导

强化学习理论中,状态价值函数、动作价值函数、贝尔曼方程系列公式推导。

2023-04-26 12:02:27 12188 11

原创 【Brainflow】Markers代码解读

对Brainflow这一python提供给脑机接口设备的库中的代码进行解读。这一篇是关于Markers的解读。

2023-03-16 15:25:12 442 6

原创 MySQL修改已有表的结构、更改主键

对已有的表做两种修改:①添加新的字段;②更改主键。在更改主键的过程中可能遇到报错ERROR 1062 (23000): Duplicate entry '' for key 'PRIMARY',有两种解决方法。

2023-01-17 23:46:10 10414

原创 【Brainflow】get_data_from_board代码解读

对Brainflow这一python提供给脑机接口设备的库中的代码进行解读。这一篇是关于get_data_from_board的解读。

2023-01-13 02:53:28 522 8

原创 【论文阅读】Sepsis World Model A MIMIC-based OpenAI Gym World Model Simulator for Sepsis Treatment

Sepsis World Model: A MIMIC-based OpenAI Gym "World Model" Simulator for Sepsis Treatment阅读笔记

2022-12-07 10:25:14 464 1

原创 【论文阅读】Medical Dead-ends and Learning to Identify High-risk States and Treatments

Medical Dead-ends and Learning to Identify High-risk States and Treatments论文阅读笔记

2022-12-07 10:17:33 404 1

原创 拿到全新的GPU云服务器之后,如何部署环境以训练模型

对于一台全新的、没有环境配置的服务器,部署环境以训练模型的一般步骤。

2022-10-31 11:24:26 834

原创 Python-多维矩阵添加高斯噪声

python向多维矩阵添加高斯噪声总共有两个步骤:①创建多维矩阵,作为添加高斯噪声的对象;②定义高斯噪声添加的函数,在其中创建噪声并添加到原噪声中。

2022-10-06 16:39:21 5576

原创 强化学习学习资源

一些入门强化学习的学习资源。

2022-10-01 12:01:29 9328 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除