wtl7-CSDN博客

原创 nvidia4090驱动安装

如果还不行，使用提示中的 '--kernel-source-path' 指定内核路径。lsmod | grep nouveau #查看是否禁用。本质在于内核版本和驱动版本不匹配，调整内核或驱动版本。

2024-05-17 16:42:07 425

原创浦语大模型6_hw_base

【代码】浦语大模型6_hw_base。

2024-02-21 08:41:08 278 1

原创浦语大模型5_hw_base

【代码】浦语大模型5_hw_base。

2024-02-20 21:33:04 170 1

原创浦语大模型4_hw_base

XTuner 大模型单卡低成本微调实战。

2024-02-20 19:47:12 385 1

import os# 加载问答链# 定义 Embeddings# 向量数据库持久化路径# 加载数据库persist_directory=persist_directory, # 允许我们将persist_directory目录保存到磁盘上# 加载自定义 LLM# 定义一个 Prompt Templatetemplate = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答案。尽量使答案简明扼要。{context}问题: {question}

2024-02-19 19:53:45 639 1

原创浦语大模型2_hw_base

【代码】浦语大模型2_hw_base。

2024-02-19 15:04:26 175 1

原创浦语大模型1

分为三个大小的模型，前两个已开源。第一节主要简介了书生浦语大模型。

2024-02-19 14:30:40 104 1

原创 Docker0_GWData-Bootcamp_HW1

docker+vscode+jupyter的最简单使用

2023-11-21 18:40:59 22 1

原创 Hash table

1.1 直接定址法1.2除留余数法1.3平方取中法1.4基数转换法2.1开放地址法2.2链地址法3.解法1：使用dict，因为python中dict内部存储方法为hash table，本质为遍历，故时空复杂度均为O（n）。解法2：使用set。故时空复杂度均为O(n)。解法3：排序，由于Quick Sort 和 Merge Sort等最快排序算法时间复杂度均为nlog(n)，遍历时间复杂度为O(n)，故最终仍为O(nlog(n))。空间复杂度为O(1)，因为空间复杂度计算的是额外需要的。

2023-11-14 20:58:00 22 1

原创甲基化疾病预测（3）

以两层为例，第一层由多个基学习器组成，其输入为原始训练集，第二层的模型则是以第一层基学习器的输出作为特征加入训练集进行再训练，从而得到完整的stacking模型。对原始数据集先划分出一个较小的留出集，比如10%训练集被当做留出集，那么Blending用90%的数据做基学习器的训练，而10%留出集用作训练元学习器，这样基学习器和元学习是用不同数据集来训练的。如Netflix 百万美元问题最后前几名的团队几乎都是由最初排名靠前的个人模型集成而来。查了一下大概是说会让结果更平滑，防止过拟合这样子。

2023-08-25 22:22:39 56 1

原创 NLP_camp(3)_BERT

我们将使用BERT模型编码中的[CLS]向量来完成二分类任务。

2023-08-25 19:08:08 28 1

原创甲基化疾病预测（2）

结果显示只有前304个位点的值不为零，其后均为零。（其实排名较为靠后的那些特征的重要性也几乎为零）总体而言比较大的收获在于提取出了少量最重要的特征以及学习了optuna的使用。故取出该304个位点训练模型。结果甚至比全部位点信息都使用还要好一点点。首先是同时使用所有485512个位点数据训练模型，并给出重要排行。故接下来考虑使用其他模型以及使用optuna调参。在精读baseline之后，进行了其他初步尝试。

2023-08-22 22:11:46 41

原创 NLP_camp(2)_LLM

大模型微调实践

2023-08-19 15:01:16 33

原创 NLP_camp(1)

输入：论文摘要+关键词输出：是否为医学文献。

2023-08-17 18:59:43 42

原创甲基化疾病预测（1）

模型输入：485512个位点的甲基化数据模型输出：对应年龄。

2023-08-17 18:24:42 62 1

m0_63348392的博客