- 博客(46)
- 问答 (1)
- 收藏
- 关注
原创 【2025】Datawhale AI春训营-蛋白质预测(AI+生命科学)-Task2笔记
c = 'X'nn.GELU(),return xinitial=0,metric / len(valid_dataloader) } ") # 保存当前 epoch 的模型 save_path = f"model.pkl" torch . save(model . state_dict() , save_path) print(f"Model saved to {03d",
2025-04-19 20:59:44
339
原创 【2025】Datawhale AI春训营-RNA结构预测(AI+创新药)-Task2笔记
几何特征生成器# 计算连续三个向量# 计算法向量# 计算二面角# 填充处理# 图构建器assert coord.shape[1:] == (7,3), f"坐标维度错误:# 图构建器 class RNAGraphBuilder : @staticmethod def build_graph(coord , seq) : assert coord . shape [ 1 : ] ==(7 , 3) , f"坐标维度错误: {
2025-04-19 20:34:58
504
原创 【强化学习理论】基于策略的强化学习——深度确定性策略梯度算法
深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)是一种Actor-Critic框架的算法,该算法常用于连续控制任务(动作空间为连续型),其中Actor网络产生的动作是具体的、确定的动作而非动作的分布,因此被称为“确定性”策略梯度。本文介绍深度确定性策略梯度算法。
2024-11-05 01:22:42
1459
原创 【强化学习理论】基于策略的强化学习——策略梯度算法
基于策略的强化学习方法通过计算动作分布进行动作选择。策略梯度算法(policy gradient,PG)是经典的基于策略的强化学习方法,本文对策略梯度算法进行介绍。
2024-11-04 17:10:58
740
原创 Transformer编码器结构及运算过程的符号表示
这篇文章主要是展示Transformer编码器的结构,同时尽量使用数学符号表达编码器的运算过程。Transformer编码器的核心结构是多头注意力机制,本文从(单头)注意力机制开始描述,然后扩展到对编码器运算过程的描述。暂不涉及解码器的描述。
2024-10-24 19:30:16
1122
原创 贝叶斯神经网络与变分推断
本文解释了贝叶斯神经网络(Bayes Neural Network, BNN)、变分推断(variational inference, VI)及二者之间的关系。
2024-10-22 23:26:07
1597
原创 【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task2笔记
本文介绍通义实验室最新的多模态手机智能体工作——Mobile-Agent。
2024-08-31 22:04:35
1716
原创 【2024】Datawhale AI夏令营-从零上手Mobile Agent-Task1笔记
Task1主要任务是跑通Mobile-Agent Demo。
2024-08-28 21:57:39
1171
原创 【PyTorch】安装pytorch方法总结
简单总结了在服务器上安装Pytorch的三种方法,分别是官网指令安装、远程下载包后本地安装以及清华镜像源安装。
2024-08-04 12:47:00
789
原创 【2024】Datawhale AI夏令营 Task4笔记——vllm加速方式修改及llm推理参数调整上分
本文承接前一篇文章,对其中vllm加速方式进行修改,推理速度获得了极大提升。另外,在延用多路投票的同时,通过调整大语言模型的参数获得了一些分数的提升。
2024-08-03 19:37:03
1460
原创 【2024】Datawhale AI夏令营 Task3笔记——Baseline2部分代码解读及初步上分思路
本文对可完成赛事“逻辑推理赛道:复杂推理能力评估”初赛的Baseline2部分关键代码进行详细解读,介绍Baseline2涉及的关键技术和初步上分思路。Baseline2代码由Datawhale AI夏令营提供,核心内容是将大语言模型部署至本地,并在此基础上使用Lora技术微调大语言模型。另外,为了加快本地推理的速度,本次任务代码使用vllm技术加速大语言模型推理(Task1和Task2方法的核心是直接调用外部大语言模型的API进行推理)。
2024-08-02 22:24:05
1024
原创 【2024】Datawhale AI夏令营 Task2笔记——Baseline代码详细解读
对可完成赛事“逻辑推理赛道:复杂推理能力评估”初赛的baseline代码进行详细解读,该baseline代码由Datawhale AI夏令营提供,核心内容是调用灵积模型服务平台的大语言模型对测试集的题目进行推理。
2024-07-30 22:03:58
912
原创 【2024】Datawhale AI夏令营 Task1
本文对Datawhale提供的对赛事【逻辑推理赛道:复杂推理能力评估】的baseline代码进行解释。
2024-07-28 23:46:59
412
原创 在pycharm 2023.2.1中运行由R语言编写的ipynb文件
项目中包含由R语言编写的ipynb文件,希望能在pycharm中运行该ipynb文件。最终未能直接在pycharm中运行该ipynb文件,但是替代的实现方法有:①能够在网页端运行由R语言编写的ipynb文件;②能够将该ipynb文件中的内容复制到一个R语言文件(以.R为后缀)中,然后在pycharm中直接运行该R语言文件。
2024-07-14 11:27:19
2450
原创 【Git】回滚旧提交版本且不影响最新提交版本
需要回滚旧提交版本,但不影响已有的所有提交版本(即不影响最新提交版本),以便需要时可以重新回滚到最新提交版本。
2024-05-06 23:20:02
1391
原创 python多线程线程池的map和starmap对比
map和starmap都是多线程中同步执行的方法,二者的差别在于用map函数放入线程池的任务只能接受一个参数;用starmap函数放入线程池的任务则可以接受多个参数。这样看来,starmap函数其实比map函数更好用。下面是案例分析(注意每个代码段里job函数的参数数量、使用的是map还是starmap)。
2023-08-06 17:59:06
1646
原创 【Brainflow】Markers代码解读
对Brainflow这一python提供给脑机接口设备的库中的代码进行解读。这一篇是关于Markers的解读。
2023-03-16 15:25:12
442
6
原创 MySQL修改已有表的结构、更改主键
对已有的表做两种修改:①添加新的字段;②更改主键。在更改主键的过程中可能遇到报错ERROR 1062 (23000): Duplicate entry '' for key 'PRIMARY',有两种解决方法。
2023-01-17 23:46:10
10414
原创 【Brainflow】get_data_from_board代码解读
对Brainflow这一python提供给脑机接口设备的库中的代码进行解读。这一篇是关于get_data_from_board的解读。
2023-01-13 02:53:28
522
8
原创 【论文阅读】Sepsis World Model A MIMIC-based OpenAI Gym World Model Simulator for Sepsis Treatment
Sepsis World Model: A MIMIC-based OpenAI Gym "World Model" Simulator for Sepsis Treatment阅读笔记
2022-12-07 10:25:14
464
1
原创 【论文阅读】Medical Dead-ends and Learning to Identify High-risk States and Treatments
Medical Dead-ends and Learning to Identify High-risk States and Treatments论文阅读笔记
2022-12-07 10:17:33
404
1
原创 Python-多维矩阵添加高斯噪声
python向多维矩阵添加高斯噪声总共有两个步骤:①创建多维矩阵,作为添加高斯噪声的对象;②定义高斯噪声添加的函数,在其中创建噪声并添加到原噪声中。
2022-10-06 16:39:21
5576
空空如也
C++中的i++与++i的区别的理解问题?
2020-03-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人