自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 Git和plink

安装plink时也是根据自己电脑的版本号选择进行安装,我的是windows的64位,由此选择以上版本进行安装,这一个下载完成之后不会出现所谓的APP标识,只会在文件夹中显示出来,完成之后就是确认是否安装成功。在工作路径下执行 mkdir ~/bin 创建bin文件夹 ,若已经存在的话会显示文件夹已存在。找到安装plink所在文件夹的右键选择Git Bash Here即可进入到Git界面,执行cp plink.exe ~/bin/ 将plink复制到bin文件夹下。,点击便会自动进行下载。

2024-05-22 16:05:08 484 1

原创 Deep-gami部分代码解读

这个函数的目的是计算分类任务的性能指标,可以根据任务类型选择计算二分类或多分类问题的 AUC,并返回准确率和平衡准确率。如果任务类型为二分类(task=='binary'),则使用 skm.roc_auc_score() 函数计算二分类问题的 AUC,并将结果保存在 auc 变量中。然后,使用阈值 0.5 对预测分数进行二值化,即将大于等于 0.5 的预测分数标记为 1,小于 0.5 的预测分数标记为 0,将结果保存在 y_pred 变量中。首先,使用 np.argmax() 函数找到每个样本的预测类别。

2024-05-14 16:52:19 852

原创 解读简单的一段深度学习代码(已跑通)

最近一直想要学习深度学习的内容,想要复现大佬的代码,试了好多有的是不给数据,有的总是跑不通,这一个是已经跑通的一个代码,以上为证,学习最快的方式就是直接实战,大部分的内容都是比较偏向于理论,个人还是偏向于直接跑通代码,这部分代码相对比较容易理解,从头到尾逐行剖析它的每一行代码。这样可以保存训练过程中损失最小的最优模型,在模型训练过程中我们会选择让模型迭代多少次,后一次循环结束之后的损失值小于前一次时便会自动进行保存最好的模型。通过预训练权重的载入,可以在保留学习信息的基础上优化模型,而不是从零开始训练。

2024-05-05 20:03:48 587

原创 Pytorch中的张量

几何代数中定义的张量是基于向量和矩阵的推广,比如我们可以将标量视为零阶张量,矢量可以视为一阶张量,矩阵就是二阶张量。张量维度代表含义0维张量代表的是标量(数字)1维张量代表的是向量2维张量代表的是矩阵3维张量时间序列数据 股价 文本数据 单张彩色图片(RGB张量是现代机器学习的基础。它的核心是一个数据容器,多数情况下,它包含数字,有时候它也包含字符串,但这种情况比较少。因此可以把它想象成一个数字的水桶。3维 = 时间序列4维 = 图像5维 = 视频。

2024-05-01 10:58:08 595

原创 文件读取方式中是否加 “./“ 的变化

所以总体来说,添加"./"更稳妥,因为明确指定从脚本目录开始查找文件,不依赖于脚本运行时的其他环境变量。如果csv文件不在脚本同目录,而是在脚本上一级目录或其他目录,则必须添加"./"指定路径,否则pd.read_csv无法找到文件而报错。"./":更明确指定是从脚本目录开始查找,不需要考虑脚本运行时的当前工作目录是否和脚本同目录。如果脚本和csv文件在同一个目录下,添加与不添加"./"效果是一样的,都可以正确读取文件。不添加,依赖于脚本运行时当前工作目录,如果工作目录变了,可能导致无法找到文件。

2024-04-29 07:22:24 136

原创 出现报错 Keras 3 only supports V3 .keras and .weights.h5 files

使用保存该模型文件的Keras版本来加载权重文件。比如如果用Keras 2.x保存的,就使用Keras 2.x版本加载。以上分别是我修改之前和修改之后的代码,在保存修改之后,一定要记得从开始重新进行加载运行,不要只运行这一部分代码。这通常意味着你正在使用Keras 3.0尝试加载一个早期版本Keras(如2.x版本)保存的模型权重文件。由于文件格式在不同Keras版本之间有变化,所以Keras 3.0不能识别早期版本保存的文件。经过多方修改后,是因为新安装的keras版本较新,与之前文件的保存格式不同。

2024-04-28 21:29:34 880

原创 Datawhale-相似度匹配-调用智谱AI api

这中间当然经历了比较多的探索,一直到如今的大模型时代,对模型输入任意一句话,它都能给我们返回一个非常不错的表示,而且依然是固定长度的向量。当然,在实际使用时,往往不会这么简单的用1/0来表示,因为每个字在句子中的作用是不一样的,所以一般会给不同的Token赋予不同的权重。其实在实际应用中我们知道每个字出现的频率是不同的,有的字是常用,有的不经常用。如果每句话都和以上的表达一样的话,那每一个字在表示时只有一个序号不为0,维度就会很高,所以此时为了解决以上的问题,就有了我们所说的Embedding方法。

2024-04-27 16:30:00 891

原创 Datawhale ChatGPT基础科普

根据课程摘写自己不懂得一些地方,具体可以再到以上项目地址LM:这是ChatGPT的基石的基石。Transformer:这是ChatGPT的基石,准确来说它的一部分是基石。GPT:本体,从GPT-1,一直到现在的GPT-4,按OpenAI自己的说法,模型还是那个模型,只是它长大了,变胖了,不过更好看了。关于这点,大家基本都没想到。现在好了,攀不上了。RLHF:ChatGPT神兵利器,有此利刃,ChatGPT才是那个ChatGPT,不然就只能是GPT-3。

2024-04-23 22:42:41 874

原创 简单应用题

题目如上图所示,给的初始代码是这样的,输入课程名称及考分信息后注意这里是使用空格进行分割,所以这里我们要根据输入的空格进行分割,使用字典来完成这个题的解答。6.计算平均值的话,对所有的键值进行相加求和再除以总的科目数,经过split函数划分之后为字符串形式,计算总的分数进行相加的时候要转化为整数再进行相加。5.排序完后此时的排序是按照从高到低的顺序进行排列,根据文章需要的最高分和最低分开始进行选择。1.首先定义一个空的字典来进行存储键值和键名,然后输入的数据开始进行循环。

2024-03-24 12:42:07 335

原创 2024第二套Python操作题

首先两个库都要进行引用,使用 r.seed 设定一个种子,t.pencolor 设定雪花的颜色,此时看清题目中要求的是绘制4个雪花,确定range的取值范围。penup是起笔,goto 是起到画笔的位置,pendown是停笔,fd是往前走,backward是回来。

2024-03-24 00:03:00 265

原创 2024Python计算机二级13

区分二叉树与完全二叉树,前序序列是先访问根节点再访问左子树和右子树,中序序列是访问左子树,根节点,右子树,后序序列是访问左子树、右子树,最后访问根节点。join()方法需要组合数据内部的元素是字符串类型,而程序中列表是数字类型。此时是前边的循环条件不满足的便不执行后边的输出,符合条件的此时只有两个。join进行连接的形式一定是字符串形式的,split切分后会形成列表形式。一维数据采用线性方式组织,集合不属于线性结构。快速排序每经过一次元素的交换会产生新的逆序。这个最小值和最大值不太明白是怎么操作出来的。

2024-03-23 16:49:53 248

原创 2024计算机二级Python 11和12

对于在函数外部定义的全局变量,若该变量为简单类型变量,在函数内部使用时需要提前使用保留字global声明其为全局变量。对于all()只要组合变量中存在值为0的元素,结果变为False,对于any()如果所有元素有一个值非0,那么结果就为True。单向列表不能再回头,只有从头指针开始才可以,双向列表会出现重复访问,二叉树节点从根开始可以达到目的。是数据库系统的核心,位于用户与操作之间,从软件分类的角度来说属于系统软件。列表对象的赋值就是简单的对象引用,一个被清空以后,另一个也被清空。

2024-03-21 17:21:12 499

原创 2024Python计算机二级7

如果front>rear,则队列中的元素个数为rear-front+m,不论它们大小关系如何都是它们进行相减,出现负数之后就再进行相加。带符号的定点数之中,正数的原码、补码和反码均相同,负数的反码是对该数的原码除符号位外各位取反,补码是在该数的反码的最后(即最右边)一位上加1;整数运算的结果可能是浮点数,除了除法之外数字类型再进行运算都会是两者之间最高等级的数据类型,比如复数高于浮点数高于整数。Django是用于web开发方向的第三方库,moviepy是用于视频剪辑,pefile用来专门解析PE文件。

2024-03-21 11:31:09 184

原创 2024Python计算机二级9和10

正数的原码、补码和反码均相同,负数的反码是对该数的原码除符号位外各位取反,补码是在该数的反码的最后一位上加1,正数或者负数的符号位取反即是漂移码。所有的器件中存储器的速度很慢,CPU访问一次内存所花的时间较长,通常用内存中读取一个指令字的最短时间来规定CPU周期,也成为机器周期。每次打印出最大值之后就会把一个最大值再删掉,此时保证了每一个值都是不相同的,不会导致每次都是相同值。但是此时又不太明白这个字典的键是如何比较的,根据索引序号吗。参数是字典时,返回的是字典的键的最大值。

2024-03-21 11:30:21 361

原创 2024计算机二级Python6

根据这个第一问来看的话还是不难的,这里文件的打开方式没有使用read.txt等打开方式,计算机二级的选择题也是一直在考察使用open来打开文件的用法,此时考生文件夹中不存在studs.txt,使用写的方式打开会进行创建。此时在判断输入的整数n是奇数还是偶数时,我觉得这两种做法都是可以的,或许是因为0的缘故。整体来看的话还是不难的,首先将输入的数据进行类型转换,设立一个空的s,然后开始对ls中的元素进行遍历,如果数据类型相同的话,都是字符串类型,便进行拼接。存储多信息的数据最适合的是列表数据类型。

2024-03-20 15:57:38 381

原创 2024计算机二级Python8

二叉树属于非线性结构 ,完全二叉树也是属于二叉树的。队列属于线性结构,循环队列也属于线性结构。在数据库的数据模型中,面向数据库管理系统且着重于数据在数据库系统一级实现的是逻辑模型。此时的结果为何只能是浮点数或者复数呢,为何不能是整数,整数属于浮点数吗,带着小数位。doit是任务管理和自动化的第三方库,NLTK是自然语言处理的第三方库。长期存储在计算机内、有组织的、可共享的大量数据集合是数据库。参数是表达式的时候会先计算出结果,再进行转换。对列表进行切片后获取到的元素依然是列表。字符串根据索引位置比较大小。

2024-03-18 21:26:40 265

原创 2024计算机二级6

9.关于Python组合数据,组合数据根据数据的关系分为序列类型、集合类型和映射类型,其中序列类型又包括字符串、元组和列表。8.在函数内部引用数字类型全局变量时,必须使用global保留字声明,在函数内部引用组合类型全局变量时,可以不通过global保留字声明。10.列表可以表示多维数据,二维数据可以看成是多个一维数据的组合,CSV格式文件既能保存一维数据,也能保存二维数据。7.在Python语言中,函数中形参的定义顺序一般为,位置参数、默认参数及可变参数,带*的为可变参数。

2024-03-15 19:58:34 312

原创 2024计算机二级5

允许多个联机用户同时使用一台计算机系统进行计算的操作系统属于分时操作系统。通过总线与内存、外设等进行连接,根据逻辑判断的话假如A对的话B、C也会对。按照字符串类型输入后,去掉引号之后会将其解释为变量。关系数据库中的键是指能唯一识别元组的最小属性集。区分是在函数内部还是外部,内部变量与外部变量。脚本语言将源代码逐条转换成目标代码并进行运行。返回值是对象的内存地址,属于数字类型。去掉字符最左侧和最右侧出现的字符。没有return则没有返回值。边界值分析属于黑盒测试。

2024-03-15 12:18:54 152

原创 2024计算机二级4

不将元素入队时循环队列可能为空也可能为满,可以将元素入队证明不为满,一共将两个元素成功入队。属性班级学生还可以细分为学生学号和学生姓名,第一属性是指其中的每个属性都不能再分为简单项。虽然一个团长可以担任多个社团的团长,但是对于一个团长来说是一对多的关系。此时是说的取值范围,不是指具体的range函数。有可能是最后一个元素或者查找的元素不在表中。采用二进制方式打开文件时,文件被解析为字节流。将文件名转化为文件存储地址的结构是文件目录。虽然可以相互转化,区分遍历循环和无限循环。

2024-03-14 23:20:40 135

原创 2024计算机二级3

计算机二级3

2024-03-14 20:28:45 217

原创 2024Python二级

第二套

2024-03-13 17:23:11 339

原创 2024计算机二级Python

第一套错题整理

2024-03-13 16:36:08 253

原创 K-means聚类方法

K-means聚类的思想和原理

2023-11-16 11:50:49 127

原创 Python中带图例的条形图的具体画法和参数调节

堆叠条形图的一些细节,如何堆叠,图列及坐标的画法

2023-11-16 11:45:34 542

原创 感知机模型

李航 统计学习方法感知机部分一些书中没有的部分的补充和计算

2023-10-12 17:27:26 185

原创 Python计算机二级基本操作题和简单应用题

基本操作题和应用题

2023-09-21 16:23:31 301 1

原创 Python 计算机二级知识点整理 模拟考试2

Python计算机二级模拟考试题

2023-09-21 14:31:58 125

原创 Python计算机二级知识点整理模拟考试

模拟考试题目

2023-09-21 09:00:42 138

原创 Python计算机二级知识点整理

计算机 Python 二级模拟考试知识点整理

2023-09-20 19:59:22 1963 1

原创 使用 sklearn 进行数学建模的通用模板

数学建模的通用流程模板讲解

2023-09-20 09:15:50 597

原创 基因型数据VCF转EXCEL亲测好用

VCF转化 excel 文件的实用方法

2023-09-14 18:47:29 474

原创 使用BWGS进行基因型数据预测

R语言中使用BWGS进行预测的一些注意事项以及要求的数据格式和具体的操作步骤

2023-09-14 12:08:34 292

原创 Python计算机二级知识点整理

Python计算机二级知识点整理第二套题

2023-09-13 16:56:47 291

原创 Python计算机Python二级知识点整理

Python计算机二级真题第一套部分题目整理

2023-09-13 12:01:47 102

原创 importance中信息增益和基尼系数

进行特征重要性选择中的importance中信息增益和基尼系数

2023-09-02 12:11:05 932

原创 出现报错:coef_ is only available when using a linear kernel

支持向量回归(SVR)使用径向基函数(RBF)核和线性核主要的区别

2023-09-02 10:24:49 410

原创 基于信息增益的特征重要性分析

基于信息增益的特征重要性分析以及相关的基本操作分析处理流程

2023-08-30 09:41:24 140

原创 全基因组选择:LightGBM通过提升GWAS敏感性促进基因挖掘

LightGBM如何通过提升GWAS敏感性促进基因挖掘的方法

2023-08-26 16:46:44 176

原创 ValueError: too many values to unpack (expected 4)

出现报错ValueError: too many values to unpack (expected 4)如何解决

2023-08-24 10:46:33 3451

原创 可解释性机器学习

可解释性机器学习的定义及其应用、在医疗和法律方面的具体代码实现、使用到的 shap 和 lime 解释器的详细示例解释

2023-08-23 21:46:10 1012

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除