自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 python 中如果对参数的取值范围进行自动触发验证

来设置 split_scale 参数值时,会自动触发验证逻辑,并在超出范围时引发错误。方法中,如果属性名与参数名不匹配,验证逻辑不会被触发。split_scale 变量,可以通过 split_scale 属性进行访问。要解决这个问题,需要将属性名和参数名保持一致。如果你希望在类对象实例化时自动触发验证,你可以使用装饰器。方法中,由于属性名与参数名不匹配,验证逻辑不会被触发。如何在类中自定义参数变量类型,并设定参数变量的值范围.方法中,不需要返回任何值。来定义类的属性,并在这个属性的。

2024-05-07 22:15:00 164 1

原创 于稀疏检索与稠密检索的混合搜索

基本方法:检索与用户查询相关的上下文,然后将其与内存缓冲区中的聊天历史记录一起发送给LLM, 让LLM在生成下一个答案时了解先前上下文。,由于用户query存在部分口语化的词,如停用词等,直接抽取用户中的关键词做召回是一个有效的方式。优点:它同时考虑了查询与存储文档之间的语义相似性和关键字匹配度;- 1. 通过将检索到的上下文逐块发送到LLM来迭代地细化答案。- 3. 同的上下文块生成多个答案,然后将它们连接或总结。- 2. 总结检索到的上下文以适应提示。:聊天历史记录和最后一条消息都。

2024-04-09 19:52:07 538 1

原创 Ubantu 报错:System has not been booted with systemd as init system (PID 1). Can‘t operate.

系统中,初始化系统是启动系统时第一个启动的进程,负责启动和管理系统中的各种服务。我在使用sytetmctl 查服务状态时中出现了这个问题。

2024-03-04 10:10:57 9451 1

原创 qwen1.5-7B hf部署运行方法以及vllm推理框架部署方法

qwen1.5 模型的问答生成方式发生了变化,不再支持 mode.chat(),但整体来看, 1.5版本的问答效果确实有了很大提升。qwen-7B 大语言模型的加载方式如下。

2024-02-21 14:02:59 2730 2

原创 hugging face 上模型文件自动下载方法札记

好了,就到这了,有新的感悟再续写, 哈哈。repo_id 是什么?

2023-10-30 16:58:00 530 2

原创 mysql:Illegal mix of collations (utf8mb4_general_ci,IMPLICIT) and (utf8mb4_unicode_ci,IMPLICIT)

之前执行了上面的第二条指令,发现控制台还是报字符编码冲突错误,后来才明白是mysql数据库创建时指定的编码与创建表时默认的编码不一致 (如下图),才出现上述错误问题;

2023-10-27 09:33:22 421 1

原创 LangChain Few-shot prompt 用法示例总结

最近有一个工作问题需要花费太多的人工时间,就考虑是否可以用LangChain Prompt进行解决。经过对LangChain 里的几种 prompt 模板对比分析,觉得 Few-shot prompt 最符合需求,然后就着手开始搭建。因为网上对于Few-shot prompt的用法资料不多,或讲解不完整,故此在这里做一下记录;

2023-09-20 15:38:44 1091 1

原创 分布式训练框架FSDP的大模型训练流程详解

FSDP是pytorch官方推出的分布式训练框架,它可以进行数据并行和模型并行的分布式训练框架。

2023-04-17 13:16:41 2417

原创 模型运行报 RuntimeError: CUDA out of memory. Tried to allocate 384.00 MiB (GPU 0; 31.75 GiB

后来发现原因是没有指定GPU,但是有时明明指定了GPU还是无法运行,后来才知道,如果你指定的GPU被占用时,它会报默认0号GPU被占用无法分配运行内存。最近在做一个多分类模型时,遇到一个下面bug,明明服务器多块GPU上有空闲GPU,却无法运行模型。

2023-03-29 14:07:00 1587

原创 Multi-label classification 遇到文本张量不一致问题

在文本多分类模型测试过程报如下错误: RuntimeError: stack expects each tensor to be equal size, but got [512] at entry 0 and [863] at entry 7.之前模型代码写的是 truncation='only_second', 如果文本数据长度差异太大,就必须 truncation设置为True. 改好后就没有上面报错。

2023-03-28 14:30:00 361 1

原创 NER任务中BERT-CRF 模型的英文数据padding与aligning

最近因为需要用BERT-CRF模型做一个英文数据的实体抽取模型训练,因为github上BERT-CRF大多是对中文数据做NER, 这里特此记录一下处理过程中的解决方法与思路,废话不多说直接上代码,这里的代码模版参考的是 CLUENER2020项目下的BERT-CRF模型代码, 主要修改部分在 collate_fn 部分的 batch数据的 padding与aligning处理。

2022-09-22 17:45:51 954

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除