溢流眼泪
码龄5年
关注
提问 私信
  • 博客:335,646
    335,646
    总访问量
  • 281
    原创
  • 94,385
    排名
  • 621
    粉丝
  • 10
    铁粉
  • 学习成就

个人简介:/*Life Continue*/

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 毕业院校: 华东师范大学
  • 加入CSDN时间: 2019-10-20
博客简介:

溢流眼泪的博客

博客描述:
本科ZJNU,目前硕一于ECNU,研究NLP,LLM方向
查看详细资料
  • 原力等级
    成就
    当前等级
    5
    当前总分
    1,428
    当月
    5
个人成就
  • 获得1,155次点赞
  • 内容获得214次评论
  • 获得1,452次收藏
  • 代码片获得1,049次分享
创作历程
  • 21篇
    2024年
  • 17篇
    2023年
  • 19篇
    2022年
  • 128篇
    2021年
  • 96篇
    2020年
成就勋章
TA的专栏
  • 【科研代码】
    20篇
  • 【科研论文学习】
  • 【算法/知识点 浅谈】
    65篇
  • 【项目开发】
    14篇
  • 【课程相关】
    13篇
  • 【游戏开发】
    9篇
  • 【解题报告 / 补题报告】
    32篇
  • 【各类ACM真题】
    130篇
兴趣领域 设置
  • Python
    python
  • Java
    java
  • 数据结构与算法
    算法数据结构
  • 人工智能
    自然语言处理语言模型
  • 游戏
    unity
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

【心得】科研上的一些里程碑式的心得

大致按照时间顺序记录一下自己在科研上的重要心得算是一个分享和记录性质的内容※不同人有不同的观点也是正常的可以对比一下每一条,自己是否有主动意识到。
原创
发布博客 2024.04.12 ·
289 阅读 ·
10 点赞 ·
0 评论 ·
2 收藏

【Python】科研代码学习:十七 模型参数合并,safetensors / bin

众所周知,LLM的模型参数一般保存在或者.bin结尾的大文件但是通过一个RLHF的一个训练后,使用了FSDP分布式训练器所以把文件参数保存在了.pt文件中那么问题来了,保存的参数我如何合并到模型里去,做其他推理任务呢?
原创
发布博客 2024.04.10 ·
3120 阅读 ·
22 点赞 ·
0 评论 ·
14 收藏

【Python】科研代码学习:十六 Model架构的代码细节,附架构图:Llama 为例 (v4.28.0)

接下来就是重头戏,我如何修改嵌入层?MLP层?注意力层?解码层?前向传播的逻辑如何实现与修改?损失如何设置和得到?就看这个重要脚本了(在 Github中,请找到自己对应模型的脚本,并建议自己打开来看一看源码)※ 本文使用的版本为v4.28.0,不同版本的源码会有所不同。
原创
发布博客 2024.03.20 ·
1665 阅读 ·
26 点赞 ·
0 评论 ·
38 收藏

【Python】科研代码学习:十五 configuration,tokenization 的代码细节:Llama 为例

对于HF的库的经典API以及大致架构我们都从前面已经学习的差不多了Tokenizer和的运作原理是什么?我如何查看与修改模型的架构?前向与反向传播过程?损失计算?激活函数?这些模型层面的内容,如何学习与具体操作?这里,建议是查看自己使用的模型,并学习其中config与modeling三个最重要的类。
原创
发布博客 2024.03.18 ·
1523 阅读 ·
18 点赞 ·
0 评论 ·
19 收藏

【Python】科研代码学习:十四 wandb (可视化AI工具)

【wandb官网】wandb是的缩写(w and b)核心作用:可视化重要参数云端存储提供各种工具可以和其他工具配合使用,比如下面的等等可以在里面使用matplotlib貌似是的上位替代。
原创
发布博客 2024.03.15 ·
2241 阅读 ·
25 点赞 ·
0 评论 ·
34 收藏

【Python】科研代码学习:十三 Accelerate

即可,里面的代码就无需修改了。
原创
发布博客 2024.03.14 ·
1042 阅读 ·
12 点赞 ·
0 评论 ·
7 收藏

【Python】科研代码学习:十二 PEFT(高效参数的训练,Adapter适配器)

【代码】【Python】科研代码学习:十二 PEFT(高效参数的训练,Adapter适配器)
原创
发布博客 2024.03.14 ·
2713 阅读 ·
36 点赞 ·
1 评论 ·
26 收藏

【Python】科研代码学习:十一 Optimization (Optimizer, Scheduler)

无需我们自己创建一个调度器,HF会按照输入的调度器名字,自动创建对应的调度器。相当于,我们通过这个类似枚举类,来指明我们使用的是哪种调度器。可以看一下,有线性的,余弦的,多项式的,常数的,带预热的等。按照这里的学习文章,说一下重要的内容,比如这个是带预热的余弦调度器。首先最重要的一个,是。
原创
发布博客 2024.03.13 ·
1700 阅读 ·
31 点赞 ·
0 评论 ·
27 收藏

【Python】科研代码学习:十 evaluate (metrics,Evaluator)

【代码】【Python】科研代码学习:十 evaluate (metrics,Evaluator)
原创
发布博客 2024.03.13 ·
1845 阅读 ·
22 点赞 ·
0 评论 ·
17 收藏

【Python】科研代码学习:九 parser,argparse,HfArgumentParser

【代码】【Python】科研代码学习:九 parser,argparse,HfArgumentParser。
原创
发布博客 2024.03.11 ·
1588 阅读 ·
30 点赞 ·
0 评论 ·
27 收藏

【Python】科研代码学习:八 FineTune PretrainedModel (用 trainer,用 script);LLM文本生成

由于默认是右侧padding,而LLM在训练时没有学会从pad_token接下来的生成策略,所以会出问题。有时候默认使用贪心策略来获取 next token,这个时候容易出问题(循环生成等),需要设置。(in one sitting = 一口气) (thug = 暴徒)也可以先选择其中一小部分的数据单独拿出来,做测试或者其他任务。(比如训练时的prompt格式),得到的结果就会不如预期。自定义分词函数,然后使用。如果输入不等长,那么会进行pad操作。比如说,QA的模板就像这样。可以把数据集进行分词。
原创
发布博客 2024.03.11 ·
1325 阅读 ·
21 点赞 ·
0 评论 ·
25 收藏

【Python】科研代码学习:七 TrainingArguments,Trainer

如果是整数,表示多少步保存一次;小数,则是按照总训练步,多少比例之后保存一次。:最多中继文件的保存上限,如果超过上限,会先把最旧的那个中继文件删了再保存新的。:是否保存到 HF hub。
原创
发布博客 2024.03.10 ·
1771 阅读 ·
34 点赞 ·
2 评论 ·
24 收藏

【Python】科研代码学习:六 ModelOutput,SpecificModel

【代码】【Python】科研代码学习:六 ModelOutput,SpecificModel。
原创
发布博客 2024.03.10 ·
1128 阅读 ·
25 点赞 ·
0 评论 ·
21 收藏

【Python】科研代码学习:五 Data Collator,Datasets

【代码】【Python】科研代码学习:五 Data Collator,Datasets。
原创
发布博客 2024.03.09 ·
1668 阅读 ·
28 点赞 ·
0 评论 ·
24 收藏

【Python】科研代码学习:四 AutoClass,Logging

HF官网:AutoClass。
原创
发布博客 2024.03.09 ·
975 阅读 ·
22 点赞 ·
0 评论 ·
24 收藏

【Python】科研代码学习:三 PreTrainedModel, PretrainedConfig, PreTrainedTokenizer

HF 官网API本文主要从官网API与源代码中学习调用HF的关键模组。
原创
发布博客 2024.03.08 ·
1782 阅读 ·
31 点赞 ·
0 评论 ·
29 收藏

【Python】科研代码学习:二 dataclass,pipeline

后文需要学习一下库,必要时会介绍其他相关的重要库和方法。主要是从源代码、别人的技术文档学习,会更快些。
原创
发布博客 2024.03.08 ·
1134 阅读 ·
19 点赞 ·
0 评论 ·
16 收藏

【自然语言处理】微调 Fine-Tuning 各种经典方法的概念汇总

(1)一些概念源自LLM(Chatgpt)和网络(百度/知乎等),笔者进行了初步检查。(2)由于其中的各种知识比较琐碎,为了形成较为结构化的知识体系,且使用最简单的、几乎无公式的介绍,故作此博客。(3)着重为自然语言处理领域NLP的,CV领域的不是很详细讲述了【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总(4)比较简单或者过于的概念就不介绍了,默认大家都学会了。不然要写的太多了。比如损失,损失函数,神经网络几个概念,不认识的话单独先去学一下。
原创
发布博客 2024.02.06 ·
4092 阅读 ·
29 点赞 ·
1 评论 ·
56 收藏

【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

(1)一些概念源自LLM(Chatgpt)和网络(百度/知乎等),笔者进行了初步检查。(2)由于其中的各种知识比较琐碎,为了形成较为结构化的知识体系,且使用最简单的、几乎无公式的介绍,故作此博客。(3)着重为机器学习ML与自然语言处理领域NLP的,CV领域的不是很详细讲述了。
原创
发布博客 2024.02.05 ·
1661 阅读 ·
17 点赞 ·
0 评论 ·
22 收藏

【VSCode,Python】一劳永逸的成功导入本地模组,PYTHONPATH的修改,与各种踩坑点

其中 aa 是在 NLP文件夹下的子文件夹。bb 是在 aa 文件夹下的子文件夹。
原创
发布博客 2024.01.14 ·
2072 阅读 ·
27 点赞 ·
1 评论 ·
28 收藏
加载更多