- 博客(15)
- 收藏
- 关注
原创 nvidia4090驱动安装
如果还不行,使用提示中的 '--kernel-source-path' 指定内核路径。lsmod | grep nouveau #查看是否禁用。本质在于内核版本和驱动版本不匹配,调整内核或驱动版本。
2024-05-17 16:42:07
425
原创 浦语大模型3_hw_base
import os# 加载问答链# 定义 Embeddings# 向量数据库持久化路径# 加载数据库persist_directory=persist_directory, # 允许我们将persist_directory目录保存到磁盘上# 加载自定义 LLM# 定义一个 Prompt Templatetemplate = """使用以下上下文来回答最后的问题。如果你不知道答案,就说你不知道,不要试图编造答案。尽量使答案简明扼要。{context}问题: {question}
2024-02-19 19:53:45
639
1
原创 Hash table
1.1 直接定址法1.2除留余数法1.3平方取中法1.4基数转换法2.1开放地址法2.2链地址法3.解法1:使用dict,因为python中dict内部存储方法为hash table,本质为遍历,故时空复杂度均为O(n)。解法2:使用set。故时空复杂度均为O(n)。解法3:排序,由于Quick Sort 和 Merge Sort等最快排序算法时间复杂度均为nlog(n),遍历时间复杂度为O(n),故最终仍为O(nlog(n))。空间复杂度为O(1),因为空间复杂度计算的是额外需要的。
2023-11-14 20:58:00
22
1
原创 甲基化疾病预测(3)
以两层为例,第一层由多个基学习器组成,其输入为原始训练集,第二层的模型则是以第一层基学习器的输出作为特征加入训练集进行再训练,从而得到完整的stacking模型。对原始数据集先划分出一个较小的留出集,比如10%训练集被当做留出集,那么Blending用90%的数据做基学习器的训练,而10%留出集用作训练元学习器,这样基学习器和元学习是用不同数据集来训练的。如Netflix 百万美元问题最后前几名的团队几乎都是由最初排名靠前的个人模型集成而来。查了一下大概是说会让结果更平滑,防止过拟合这样子。
2023-08-25 22:22:39
56
1
原创 甲基化疾病预测(2)
结果显示只有前304个位点的值不为零,其后均为零。(其实排名较为靠后的那些特征的重要性也几乎为零)总体而言比较大的收获在于提取出了少量最重要的特征以及学习了optuna的使用。故取出该304个位点训练模型。结果甚至比全部位点信息都使用还要好一点点。首先是同时使用所有485512个位点数据训练模型,并给出重要排行。故接下来考虑使用其他模型以及使用optuna调参。在精读baseline之后,进行了其他初步尝试。
2023-08-22 22:11:46
41
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人