自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 OpenCompass 大模型评测

关于评测的三个问题关于评测的三个问题为什么需要评测模型选择模型能力提升真实应用成精效果评测我们需要测什么知识、推理、语言长文本、智能体、多轮对话情感、认知、价值观怎样测试大语言模型自动化客观评测人机交互评测基于大模型评测。

2024-01-20 18:05:15 842

原创 LMDeploy 大模型量化部署实践

将训练好的模型在特定软硬件环境中启动的过程,是模型能够接受输入并返回预测结果。为了满足性能和效率的需求,常常需要对模型进行优化,例如模型压缩和硬件加速。在英伟达设备上部署的全流程解决方案。云端、边缘计算段、移动端。逐个生成,且数量不定。

2024-01-18 13:10:29 407 1

原创 XTuner 大模型单卡低成本微调实战

的下游应用中,增量预训练和指令跟随是经常会用到两种的微调模式。使用场景:让基座模型学习到一些新知识,如某个垂类领域的常识。使用场景:让模型学会对话模板,根据人类指令进行对话。以配置文件的形式封装了大部分微调场景,指令跟随微调是未来得到能够实际对话的。旁,新增一个支路,包含两个连续的小。训练数据:高质量的对话、问答数据。在实际对话时,通常会有三种角色。内置了多种热门数据集的映射函数。训练这些参数会耗费大量的显存。的参数量主要集中在模型中的。,能大幅降低训练的显存消耗。不同的模型会有不同的模板。

2024-01-12 17:21:34 409 1

原创 基于 InternLM 和 LangChain 搭建知识库

完成 LangChain 的自定义 LLM 子类之后,可以以完全一致的方式调用 LangChain 的接口,而无需考虑底层模型调用的不一致。将上述仓库中所有满足条件的文件路径找出来,我们定义一个函数,该函数将递归指定文件夹路径,返回其中所有满足条件(即后缀名为 .md 或者 .txt 的文件)的文件路径。选择 Chroma 作为向量数据库,基于上文分块后的文档以及加载的开源向量化模型,将语料加载到指定路径下的向量数据库。目录下已存储有所需的模型文件参数,可以直接拷贝到个人目录的模型保存地址。

2024-01-09 16:46:16 940 1

原创 轻松玩转书生·浦语大模型趣味 Demo

通过单一的代码库,InterLM支持在拥有数千GPU的大型集群上进行预训练,并在单个GPU上进行微调,同时实现理卓越的性能优化。lagent是一个轻量级、开源的基于大语言模型的智能日(agent)框架,用户可以快速得将一个大语言模型转变为多种类型的智能体,并提供了一些典形工具为大语言模型赋能。

2024-01-07 16:25:22 931 1

原创 书生·浦语大模型全链路开源体系

文本数据 多模态融合。视频数据 价值观对齐。OpenDataLab----开放数据。根据业务场景的复杂程度判断是否进行参数调整。图像文本数据集 精细化处理。数据-预训练-微调-部署-评测-应用。多模态智能体工具想AgentLego。轻量级智能体框架Lagent。通用大模型:一个模型应对多种任务、多种模态。高效微调框架Xtuner。大模型成为发展通用人工智能的重要途经。书生·浦语全链条开源开放体系。

2024-01-04 15:55:52 376

原创 GAN-BASED SAR-TO-OPTICAL IMAGE TRANSLATION WITH REGION INFORMATION

将SAR图像区域信息引入生成网络中。

2023-06-14 10:53:11 542 1

原创 SPP网络结构——原网络与YOLOv5中修改结构的比较

—以原论文图像和在CNN中的应用为例SPPNet的函数定义(代码来源——参考3)SPPNet网络结构固定输出大小。实现过程1.输出不同大小的特征图。2. 经过最大池化操作——通过输入与输出,确定步长stride,池化核的大小,填充的大小padding。3. 获得输出——每张特征图输出成三种不同的大小(4,4),(2,2),(1,1)。个人理解就是把不同大小的特征图经过SPP操作后生成了3中大小相同的特征图。4. 进行全连接操作 ——输出(4×4+2×2+1×1)×c(通道数)。实现过程。

2023-04-12 23:25:34 358 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除