自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【bug解决】chatglm3推理 ValueError: too many values to unpack (expected 2)

chatglm3推理报错:too many values to unpack (expected 2)原因是transformers版本过高,修改为transformers==4.41.2。

2024-07-14 21:07:45 53

原创 【论文阅读】Seven Failure Points When Engineering a Retrieval Augmented Generation System

论文从软件工程的角度,通过对3个case study的研究,总结出rag的7个故障点。

2024-07-13 12:08:24 621 2

原创 【论文阅读】RAFT: Adapting Language Model to Domain Specific RAG

这篇论文主要是研究如何提升RAG中pre-trained LLM在垂域知识中的开卷考试的能力,提出了一种名为“RAFT”的训练范式。RAG的一个挑战在于,检索内容中同时包含golden document(正确的文档)和distractor documents(相关但非正确的混淆文档)时,大模型可能会从distractor document中抽取出错误回答。RAFT通过构造COT类型的QA对数据集来微调模型,从而提升大模型的推理能力。

2024-07-02 21:25:27 307 1

原创 【bug解决】vllm部署qwen

首次尝试vllm部署qwen遇到的一些问题。

2024-06-23 23:41:49 171

原创 【bug解决】AutoDL上streamlit部署LLM,Network URL无法访问

通过本地访问Network URL,长时间无响应后请求失败。且无法从本地ping通该ip。尝试了github上诸多方法均无效后,怀疑是服务器无独立公网IP导致。2、启动streamlit服务时,设置端口为127.0.0.1,端口为6006。执行streamlit run xx.py后的得到Network URL,3、打开链接成功请求到streamlit服务,开始愉快地对话吧~1、打开自定义服务,根据对应操作系统进行配置。通过查看AutoDL官方文档,

2024-06-20 00:15:04 209

原创 【bug解决】llama3微调bug解决

infnaninf。

2024-06-19 02:03:38 380

原创 【bug解决】deepspeed zero3 pretrain alpaca

找到代码中的low_cpu_mem_usage=True改为False。

2024-04-17 22:37:15 176

原创 【bug解决】huggingface-cli下载模型到cache

通过huggingface-cli下载模型,cache占用高。

2024-04-08 21:16:27 281

原创 【bug解决】Lora微调chatglm6b出现step10后loss持续为0

lora微调过程中出现loss持续为0。

2024-04-07 21:14:55 397 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除