卡洛驰-CSDN博客

原创如何使用trl进行LoRA微调

本文介绍了使用trl库对Qwen-2.5模型进行SFT LoRA微调的方法，同时介绍了如何使用Deepspeed进行并行训练。

2025-11-09 19:29:55 1084

原创 L2正则与Weight Decay的区别？详解

为什么L2正则化与Weight Decay在Adam中效果不同？

2025-03-18 15:20:21 1278

原创交叉熵损失函数详解

交叉熵损失函数详解。

2024-11-06 15:49:50 2450

原创 N-gram详解

对于N-gram的详细解释。

2024-10-24 22:19:33 2743 1

原创 Adam优化器算法详解

Adam优化器算法详解。

2024-10-24 18:32:22 2296

原创什么是标准差？详解

标准差计算详解。

2024-10-22 15:37:22 10951

原创 L2正则化详解

L2正则化详解。

2024-10-19 21:25:01 3363

原创 L1正则化详解

L1正则化详解。

2024-10-19 21:24:00 2046

原创什么是AUC？详解

AUC详解。

2024-10-18 18:00:58 1641

原创常见模型评价标准

本文详细解释了准确率（Accuracy）、精确率（Precision）、召回率（Recall）以及 F1 分数。

2024-10-18 17:32:39 1326

原创给你的博客头像加一个进度条吧！

使用“油猴脚本”为CSDN博客主页头像添加一个进度条UI。

2024-10-16 18:00:56 828

原创什么是Token？LLM中的Token使用浅析

对自然语言处理中的token简单解释。

2024-10-16 15:56:51 1252

原创 Softmax函数计算详解

Softmax函数计算详解。

2024-10-15 12:03:19 3632 2

原创如何在 Java 中将String转换为int？

Java字符串转整数方法。

2024-10-09 17:50:37 478

原创如何计算Token数量

使用Tiktoken轻松计算Token数量 | OpenAI秘籍

2024-10-08 11:36:42 2410

原创 KV-Cache详解

本文探讨了 KV 缓存的概念、应用以及它在自注意力机制中优化的特定计算。

2024-09-18 15:45:55 14625 6

原创 Scaled Dot-Product Attention详解

本文详细介绍了 Scaled Dot-Product Attention 的机制、计算步骤、以及一个详细的计算过程样例。

2024-08-13 15:43:57 5548 1

原创 Sigmoid函数求导：保姆级推导过程

本文详细介绍了两种求导Sigmoid函数的方法，即使是初学者也能轻松理解。

2023-01-23 13:43:19 16043 5

原创 30分钟做一个人脸识别案例

文章基于face_recognition+OpenCV总结一下经验，以及遇到的坑。

2019-08-08 00:43:36 2375

原创 Python爬虫获取农业银行结售汇汇率

获取银行实时汇率，并通过邮箱发送更新通知。

2019-07-29 15:40:53 3839

SFT训练数据样例，Conversational格式

资源仅是样例数据，经过清理后的json格式。完整资源请访问原地址。数据来源：https://huggingface.co/datasets/trl-lib/ultrafeedback-gpt-3.5-turbo-helpfulness/tree/main/data

2025-11-08

简单的java登录界面

简单的java登录界面，GUI程序设计。依靠数数组实现存储用户信息，有注册界面。

2018-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人