自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

溢流眼泪的博客

本科ZJNU,目前硕一于ECNU,研究NLP,LLM方向

  • 博客(281)
  • 收藏
  • 关注

原创 【Unity 工具,简单学习】DoTween,脚本控制动画工具

Tween 简单来说,就是用简单的代码可以控制任何动画表现,诸如移动、旋转、颜色、各种其他UI元素。

2023-03-13 20:02:30 2073 2

原创 【腾讯云轻量级服务器】腾讯云服务器,Linux宝塔,Unity导出WebGL并部署

腾讯云服务器,Linux宝塔,Unity导出WebGL并部署

2023-03-09 22:36:33 1123

原创 【Unity】Delegate, Event, UnityEvent, Action, UnityAction, Func 傻傻分不清

学习打开别人一个魔塔的项目,看到了满页的 `Action` 代码,而本人委托那一块自己写的时候压根不会用……遂学习相关知识。**多数学习自知乎****本文可能会有知识点错误,欢迎讨论。**

2022-12-26 22:43:16 7442 5

原创 【小组专题二:博弈论入门综述(1)】NP状态 | SG函数 | 巴什博奕、威佐夫博弈、斐波那契博弈、Nim游戏、SJ定理

博弈论综述【1】前言博弈与博弈论博弈树NP状态SG函数(Sprague-Grundy)Sprague-Grundy Theorem巴什博奕 Bash Game威佐夫博弈扩展威佐夫博弈斐波那契博弈Nim博弈拓展Nim博弈与Nim博弈的各个变种(1)拓展维度(2)先手怎么取(3)求先手一开始有多少种取得方式能够赢(4) 变形:有拿取上限(NYOJ-135)(5) 阶梯博弈(**Nim Staircase**博弈)最后的最后:SJ定理与Anti-SG游戏各种练习题啦!可能下期会将的内容(?) 博弈与博弈论

2020-09-03 14:19:56 2437 4

原创 【心得】科研上的一些里程碑式的心得

大致按照时间顺序记录一下自己在科研上的重要心得算是一个分享和记录性质的内容※不同人有不同的观点也是正常的可以对比一下每一条,自己是否有主动意识到。

2024-04-12 16:53:20 156

原创 【Python】科研代码学习:十七 模型参数合并,safetensors / bin

众所周知,LLM的模型参数一般保存在或者.bin结尾的大文件但是通过一个RLHF的一个训练后,使用了FSDP分布式训练器所以把文件参数保存在了.pt文件中那么问题来了,保存的参数我如何合并到模型里去,做其他推理任务呢?

2024-04-10 21:59:07 1028

原创 【Python】科研代码学习:十六 Model架构的代码细节,附架构图:Llama 为例 (v4.28.0)

接下来就是重头戏,我如何修改嵌入层?MLP层?注意力层?解码层?前向传播的逻辑如何实现与修改?损失如何设置和得到?就看这个重要脚本了(在 Github中,请找到自己对应模型的脚本,并建议自己打开来看一看源码)※ 本文使用的版本为v4.28.0,不同版本的源码会有所不同。

2024-03-20 17:34:45 960

原创 【Python】科研代码学习:十五 configuration,tokenization 的代码细节:Llama 为例

对于HF的库的经典API以及大致架构我们都从前面已经学习的差不多了Tokenizer和的运作原理是什么?我如何查看与修改模型的架构?前向与反向传播过程?损失计算?激活函数?这些模型层面的内容,如何学习与具体操作?这里,建议是查看自己使用的模型,并学习其中config与modeling三个最重要的类。

2024-03-18 17:55:08 1013

原创 【Python】科研代码学习:十四 wandb (可视化AI工具)

【wandb官网】wandb是的缩写(w and b)核心作用:可视化重要参数云端存储提供各种工具可以和其他工具配合使用,比如下面的等等可以在里面使用matplotlib貌似是的上位替代。

2024-03-15 18:09:59 1444

原创 【Python】科研代码学习:十三 Accelerate

即可,里面的代码就无需修改了。

2024-03-14 20:51:04 611

原创 【Python】科研代码学习:十二 PEFT(高效参数的训练,Adapter适配器)

【代码】【Python】科研代码学习:十二 PEFT(高效参数的训练,Adapter适配器)

2024-03-14 19:44:14 1622 1

原创 【Python】科研代码学习:十一 Optimization (Optimizer, Scheduler)

无需我们自己创建一个调度器,HF会按照输入的调度器名字,自动创建对应的调度器。相当于,我们通过这个类似枚举类,来指明我们使用的是哪种调度器。可以看一下,有线性的,余弦的,多项式的,常数的,带预热的等。按照这里的学习文章,说一下重要的内容,比如这个是带预热的余弦调度器。首先最重要的一个,是。

2024-03-13 20:56:34 1292

原创 【Python】科研代码学习:十 evaluate (metrics,Evaluator)

【代码】【Python】科研代码学习:十 evaluate (metrics,Evaluator)

2024-03-13 17:39:27 1145

原创 【Python】科研代码学习:九 parser,argparse,HfArgumentParser

【代码】【Python】科研代码学习:九 parser,argparse,HfArgumentParser。

2024-03-11 21:36:27 1145

原创 【Python】科研代码学习:八 FineTune PretrainedModel (用 trainer,用 script);LLM文本生成

由于默认是右侧padding,而LLM在训练时没有学会从pad_token接下来的生成策略,所以会出问题。有时候默认使用贪心策略来获取 next token,这个时候容易出问题(循环生成等),需要设置。(in one sitting = 一口气) (thug = 暴徒)也可以先选择其中一小部分的数据单独拿出来,做测试或者其他任务。(比如训练时的prompt格式),得到的结果就会不如预期。自定义分词函数,然后使用。如果输入不等长,那么会进行pad操作。比如说,QA的模板就像这样。可以把数据集进行分词。

2024-03-11 17:56:12 1037

原创 【Python】科研代码学习:七 TrainingArguments,Trainer

如果是整数,表示多少步保存一次;小数,则是按照总训练步,多少比例之后保存一次。:最多中继文件的保存上限,如果超过上限,会先把最旧的那个中继文件删了再保存新的。:是否保存到 HF hub。

2024-03-10 20:51:07 1335 2

原创 【Python】科研代码学习:六 ModelOutput,SpecificModel

【代码】【Python】科研代码学习:六 ModelOutput,SpecificModel。

2024-03-10 19:18:16 956

原创 【Python】科研代码学习:五 Data Collator,Datasets

【代码】【Python】科研代码学习:五 Data Collator,Datasets。

2024-03-09 19:06:53 1080

原创 【Python】科研代码学习:四 AutoClass,Logging

HF官网:AutoClass。

2024-03-09 17:08:21 816

原创 【Python】科研代码学习:三 PreTrainedModel, PretrainedConfig, PreTrainedTokenizer

HF 官网API本文主要从官网API与源代码中学习调用HF的关键模组。

2024-03-08 22:03:50 1152

原创 【Python】科研代码学习:二 dataclass,pipeline

后文需要学习一下库,必要时会介绍其他相关的重要库和方法。主要是从源代码、别人的技术文档学习,会更快些。

2024-03-08 19:58:04 993

原创 【自然语言处理】微调 Fine-Tuning 各种经典方法的概念汇总

(1)一些概念源自LLM(Chatgpt)和网络(百度/知乎等),笔者进行了初步检查。(2)由于其中的各种知识比较琐碎,为了形成较为结构化的知识体系,且使用最简单的、几乎无公式的介绍,故作此博客。(3)着重为自然语言处理领域NLP的,CV领域的不是很详细讲述了【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总(4)比较简单或者过于的概念就不介绍了,默认大家都学会了。不然要写的太多了。比如损失,损失函数,神经网络几个概念,不认识的话单独先去学一下。

2024-02-06 20:10:49 1982 1

原创 【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

(1)一些概念源自LLM(Chatgpt)和网络(百度/知乎等),笔者进行了初步检查。(2)由于其中的各种知识比较琐碎,为了形成较为结构化的知识体系,且使用最简单的、几乎无公式的介绍,故作此博客。(3)着重为机器学习ML与自然语言处理领域NLP的,CV领域的不是很详细讲述了。

2024-02-05 23:32:15 1311

原创 【VSCode,Python】一劳永逸的成功导入本地模组,PYTHONPATH的修改,与各种踩坑点

其中 aa 是在 NLP文件夹下的子文件夹。bb 是在 aa 文件夹下的子文件夹。

2024-01-14 20:10:31 1440 1

原创 【Python】科研代码学习:一

搞科研,最重要的还是得看懂别人的源代码。这就意味着python不能太差看到比较有用的,或者不怎么看懂的代码,就搜索并学习,放在这里,供学习参考。∗∗在编译器中对包或者类或者方法,点击F12查看源码,而不是百度问怎么获得啥啥参数∗∗\color{red}** 在编译器中对包或者类或者方法,点击F12查看源码,而不是百度问怎么获得啥啥参数**∗∗在编译器中对包或者类或者方法,点击F12查看源码,而不是百度问怎么获得啥啥参数∗∗。

2024-01-10 19:28:48 846

原创 【论文文献管理与同步】Zotero + 坚果云 + Zotfile :多设备论文管理与同步

【论文文献管理与同步】Zotero + 坚果云 + Zotfile :多设备论文管理与同步

2023-09-27 18:38:38 2144 1

原创 【NLP,Huggingface,Colab】使用 Trainer 训练模型,并保存模型参数

【代码】【NLP,Huggingface,Colab】使用 Trainer 训练模型,并保存模型参数。

2023-07-10 22:29:26 2185

原创 【如何成功加载 HuggingFace 数据集】不使用Colab,以ChnSentiCorp数据集为例

【如何成功加载 HuggingFace 数据集】不使用Colab,以ChnSentiCorp数据集为例

2023-07-07 23:23:53 911 1

原创 【TikZ 简单学习(下):基础绘制】Latex下的绘图宏包

【代码】【TikZ 简单学习(下):基础绘制】Latex下的绘图宏包。

2023-05-23 17:36:59 1231

原创 【TikZ 简单学习(上):基础绘制】Latex下的绘图宏包

【代码】【TikZ 简单学习(上):基础绘制】Latex下的绘图宏包。

2023-05-21 23:14:42 1934

原创 【Unity 导出 WebGL 通过Linux宝塔的 Nginx 连接数据库】使用 UnityWebRequest 与 WebAPI (php服务) 执行mysql命令

做项目,需要Unity导出的WebGL项目能进行与数据库交互,这里指能实现insert命令即成功项目已经成功部署在 腾讯云服务器下,通过Linux宝塔的Nginx部署。于是通过chatGPT紧急学习了其他相关技术,来实现与数据库交互的功能。

2023-04-12 22:28:08 1101 2

原创 【深度学习,NLP,LM】Alpaca-Lora ,Colab上部署与调用

Alpaca-Lora Huggingface项目Tloen/Alpaca-Lora GitHub项目如何简单使用Colab。

2023-04-06 17:36:55 959

原创 【数论+莫比乌斯反演】Exclusive Multiplication | gym103688E

【数论+莫比乌斯反演】Exclusive Multiplication | gym103688E

2023-04-03 20:24:20 507 2

原创 加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决

加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决

2023-03-29 21:56:46 8050 4

原创 【Unity工具,简单应用】Photon + PUN 2,做一个简单多人在线聊天室

【Unity工具,简单应用】Photon + PUN 2,做一个简单多人在线聊天室

2023-03-22 15:35:49 1564 4

原创 【Unity工具,简单学习】PUN 2,多人在线游戏开发,初步使用

链接PUN可以让你简单地开发多人游戏,在全球范围推出让开发者不用管托管、链接和延迟支持移动端、台式、一些主机全球范围内低延迟始终连接,无需穿透免费20CCU(Concurrent User, 并发用户)支持 Unity 2019 - 2022。

2023-03-21 16:41:59 2576

原创 【Jupyter Notebook的简单入门使用】

Jupyter Notebook 介绍简单来讲,它是一个网页应用,可以进行文档编写,甚至运行 py 代码等功能。

2023-02-24 21:02:06 547 1

原创 【在 Colab 中使用 TensorBoard 绘图】

【代码】【在 Colab 中使用 TensorBoard 绘图】

2023-02-23 16:32:13 891

原创 【Unity + C#】键为类的字典的问题

即使键中的类的属性一样,实例不同,字典是会出错的。给出了 Dictionary 和 SortedDictionary 两种不同的实现方式。

2023-01-02 22:35:06 310

原创 【Unity + LitJson】字典键为int或Enum时报错,InvalidCastException: Specified cast is not valid

字典键为int或Enum时报错,InvalidCastException: Specified cast is not valid报错信息 + 报错原因 + 简单解决方案

2023-01-02 19:17:58 701

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除