自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Rcrfrvtb的博客

原创微调模型lora

用于配置 LoRA 微调的参数，包括秩、alpha 参数、dropout 率、目标模块、权重路径、偏置类型和是否使用 QLoRA。数据预处理函数，将输入文本转换为模型可以处理的格式，包括 tokenization 和 padding。用于配置训练参数，包括缓存目录、优化器、最大序列长度、是否使用 LoRA 和系统提示词。训练函数，加载模型和分词器，配置 LoRA 模型，创建 Trainer 并开始训练。模型合并函数，将微调后的 LoRA 模型与基础模型合并并卸载。监督数据集类，用于微调数据集的预处理。

2024-06-23 23:12:41 143

原创 TF-IDF加权的词频字典

泛化能力：这种方法无需依赖特定的停用词列表，可以自动适应不同领域和不同类型的文本，提高了方法的泛化能力。无论文本中包含何种词汇，公式都能有效调整其权重，计算出准确的相似度。高可靠性：通过自适应权重调整，公式能够可靠地处理不同文档中的高频词和低频词，避免了高频词对相似度计算的过度影响，提高了结果的可靠性。

2024-06-23 18:06:15 206

原创问题分类部分

这段代码通过加载预训练的大语言模型，并结合上下文学习和简单的决策树方法，完成了对问题的分类任务。上下文学习通过提供示例问题和答案，帮助模型理解分类任务，而决策树方法则在模型生成响应的基础上，结合问题中的特定关键词（如公司名称）进行进一步的决策，从而提高分类的准确性。

2024-06-20 23:40:24 758

原创项目的模型部署

这是我们在大模型项目中遇到的部署问题及解决过程。选择合适的算力资源：在选择算力资源时，考虑到显存需求和费用问题，选择最合适的平台。适应新平台：在新平台上操作时，多向客服咨询，合理使用数据盘和系统盘。正确下载和部署模型：注意下载路径，避免内存占用问题。通过这次经历，我们不仅完成了项目，还学到了很多关于算力平台使用和模型部署的知识。如果你也在进行类似的项目，希望这些经验能对你有所帮助。希望这篇博客内容能帮助其他面临类似问题的开发者。如果你有任何问题或建议，欢迎在评论区留言！

2024-05-29 20:09:48 397

原创基于大语言模型的商业答疑系统

自定义的tokenizer这是我们在大模型项目中遇到的部署问题及解决过程，以及详细的模型使用和操作方法，包括如何使用tokenizer。选择合适的算力资源：在选择算力资源时，考虑到显存需求和费用问题，选择最合适的平台。适应新平台：在新平台上操作时，多向客服咨询，合理使用数据盘和系统盘。正确下载和部署模型：注意下载路径，避免内存占用问题。模型使用和微调：了解如何加载、生成文本、微调和评估模型。Tokenizer的使用：掌握文本编码、解码、处理批量数据和自定义配置等高级功能。

2024-04-07 14:44:46 509

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

DanceinDmajor CSDN认证博客专家 CSDN认证企业博客

码龄3年

IP 属地：山东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

5: 原创

122万+: 周排名

14万+: 总排名

2012: 访问

: 等级

80: 积分

18: 粉丝

25: 获赞

0: 评论

26: 收藏

私信

关注

热门文章

最新文章

提示

确定要删除当前文章？

取消删除