自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 问答 (1)
  • 收藏
  • 关注

原创 从头开始构建GPT标记器

SolidGoldMagikarp”实际上是一个Reddit用户,分词数据集与实际语言模型的训练数据集非常不同,所以在分词数据集中,可能有大量的Reddit数据,因为“SolidGoldMagikarp”是一个经常发帖的人,这个词出现的频率很高,所以被合并成一个单独的标记,但是当你训练模型的时候,这些字符串没有在Reddit的数据中出现,这个标记在优化的开始是随机初始化的,并且在模型训练的过程中从未被更新过。随着词汇量的增加,嵌入表的大小也会增加,从而线性层的大小也会增加,所以要消耗更多的计算资源;

2024-05-30 20:02:32 1061 1

翻译 什么是编码器和解码器?

一般来说,编码器和解码器Transformers都使用相同的自注意力层来编码token。主要区别在于编码器旨在学习可用于各种预测类任务(如分类)的嵌入,而解码器则设计用于生成新文本,例如回答用户查询。

2024-05-21 20:18:07 276

原创 如何让机器理解人类语言?Embedding技术详解

在语言理解方面,人类的能力是无与伦比的。因为人脑能够轻松理解语言中的各种情感信息,例如幽默、讽刺、负面情绪等,只是我们必须了解句子所用的语言。例如,如果有人用英语评论我的文章,如果不借助翻译我可能很难理解对方想要表达的内容,所以为了有效的沟通,我们需要用对方最熟悉的语言进行交流。同理,为了让机器能够处理并理解任何类型的文本,需要我们将文本表示为机器能够理解的“语言”。那么,机器最擅长理解哪种语言呢?没错,就是数字。无论我们提供什么样的数据给机器,例如视频、音频、图片或是文本,机器最终都只能处理数字。

2024-05-13 15:44:51 981

原创 正则表达式:文本处理的利器

这些是常见的字符类的简写形式。

2024-05-11 16:11:47 876

原创 AutoDL如何下载huggingface模型

本人使用AutoDL下载huggingface时,下面是我尝试过的一些方法,但有的方法对我来说没用,最后一种方法是最方便的,如果不想尝试前面的几种方法可以直接用最后一种。由于AutoDL和阿里网盘是可以相互传输数据的,所以就先通过colab将模型下载到阿里网盘,再将模型上传到AutoDL。如果使用huggingface官网下载模型,首先需要利用token登陆,如果没有token,需要先在。查阅资料后解释是模型太大,下载过程网路不稳定,需要关闭VPN,所以该方法对下载太大的模型可能行不通。

2024-05-10 13:05:16 2847

原创 模型训练加速策略:掌握数据并行的力量

在深入讨论之前,我们首先需要理解何为“数据并行”(Data Parallelism)。数据并行是并行计算的一种形式,它涉及到在多个处理单元(如GPU)上同时执行计算任务。在深度学习中,这意味着模型可以在不同的GPU上同时训练,每个GPU处理数据集的不同部分。

2024-05-08 11:00:00 886

原创 为什么要梯度累积

随着深度学习模型变得越来越复杂,模型的训练通常需要更多的计算资源,特别是在训练期间需要更多的内存。在训练深度学习模型时,在硬件资源有限的情况下,很难使用大批量数据进行有效学习。大批量数据通常可以带来更好的梯度估计,但同时也需要大量的内存。梯度累积是一种巧妙的技术,它允许在不增加内存需求的情况下,有效地使用更大的批量数据来训练深度学习模型。

2024-05-06 16:09:33 1010

原创 kaggle酶稳定性预测第三名解决方案分享

我分别使用了如下三个数据集训练了三个11-fold xgb模型。数据集1数据集2数据集3和以下公共笔记本ensemble后得到最终结果。rosettarmsd第一点是利用三维坐标来构建突变残基的环境,例如相邻残基和突变残基之间的相对距离。第二点是,现有的服务器或模型,如Rosetta、FoldX、ESM等,在这场比赛中取得了不错的成绩。第三点是找到方法来区分野生型和突变型。在这次比赛中,很多公共笔记本都使用了野生型,但注意野生型和突变型的区别可能也会有所帮助。参考资料:[1]

2023-04-20 13:36:17 1234 6

原创 【Linux】Shell基础--Bash变量

Shell基础

2022-04-23 10:14:17 1573 13

原创 【机器学习】推荐算法(附例题代码)

推荐算法

2022-04-07 13:18:48 8957 57

原创 汇编指令合集

汇编指令合集

2022-04-03 13:58:49 6866 59

原创 【Linux】Shell基础-Bash基本功能

Shell基础(一)

2022-04-01 16:45:39 1603 19

原创 【Linux】文件系统管理

Linux入门笔记之文件系统管理

2022-03-09 08:33:57 13047 51

原创 【机器学习】聚类分析与主成分分析(附例题源码)

机器学习聚类分析和PCA详解

2022-02-28 08:37:32 4672 42

原创 【Linux】权限管理详解

Linux基础知识

2022-02-24 22:14:25 1493 24

原创 【机器学习】支持向量机原理及例题详解

支持向量机(SVM)详解

2022-02-17 22:42:26 7689 29

原创 【Linux】用户管理命令

Linux用户管理命令

2022-02-14 17:43:01 3735 37

原创 【机器学习】神经网络识别手写数字(附python源码)

神经网络

2022-02-12 13:11:31 7873 39

原创 【Linux】软件包管理超详细笔记

Linux软件包管理详细笔记

2022-02-09 17:00:13 3787 21

原创 【机器学习】Logistic回归详解(含源码)

机器学习入门,Logistic回归超详细学习笔记。

2022-02-04 20:11:33 5636 32

原创 【Linux】文本编辑器Vim

Linux文本编辑器Vim详细学习笔记

2022-02-02 18:03:32 3322 13

原创 Linux常用指令合集

Linux常用指令合集

2022-01-30 17:30:31 20105 35

原创 【数据结构与算法】图的基本概念回顾

【数据结构与算法】图的基本概念回顾

2022-01-23 20:17:02 935 11

原创 【机器学习】梯度下降与正规方程(附例题代码)

机器学习入门,关于梯度下降与正规方程的详细讲解

2022-01-19 16:36:33 3295 31

原创 【LeetCode题解】BFS层序遍历二叉树

102二叉树的层序遍历

2022-01-07 10:39:05 1544 13

原创 【数据结构与算法】二叉树

二叉树

2022-01-05 21:42:03 1078 23

原创 【数据结构与算法】LeetCode单链表习题(一)

反转链表、链表的中间结点,链表中倒数第k个结点,合并两个有序链表、链表分割,回文链表​

2021-12-29 23:05:37 937 24

原创 【数据结构与算法】栈与队列

栈与队列

2021-12-22 13:19:20 1525 15

原创 【数据结构与算法】双向链表C语言描述

【数据结构与算法】双向链表C语言描述

2021-12-17 08:00:00 2156 17

原创 数据结构与算法----单链表

单链表文章目录单链表创建节点链表的打印链表的插入尾插:在最后一个结点的后面插入一个新的结点尾删尾删完整代码如下头插头删头删完整代码如下查找&修改在指定位置结点后面插入完整代码:删除指定位置结点后面的一个结点完整代码创建节点struct SListNode{ SListDataType data; struct SListNode* next;};为了方便表示,再给结构体定义新的类型名typedef struct SListNode{ SListDataType data;

2021-12-06 21:14:04 902 29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除