自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 nlp实战|训练bert实现多标签文本分类

训练bert实现识别文本的多标签

2024-11-13 22:24:30 206

原创 搜推广|elasticsearch 8.x 如何安装Hanlp插件

实现从源码打包出可以适配elasticsearch8.X版本的hanlp插件。

2024-11-12 17:28:43 710

原创 介绍llama2|debug源码解读旋转位置编码RoPE(二)

从理论和代码的角度剖析llama旋转位置编码

2024-10-31 22:24:45 682

原创 基本功|解读大模型预训练时的损失函数

图片+代码理解大模型预训练时候的损失函数

2024-10-23 09:29:53 266

原创 基本功|解读大模型预训练时候的损失函数

深入理解大模型预训练时候的损失函数

2024-10-23 00:38:03 468

原创 介绍llama2|数学之美与旋转位置编码RoPE(一)

快速理解旋转位置编码的意义和原理

2024-10-13 22:40:35 1071

原创 介绍llama2|理解group query attention(GQA)

多角度分析llama模型的group query attention

2024-09-29 00:00:25 1117

原创 大模型微调|根据低秩近似理解lora(二)

为何低秩适配行之有效?它行之有效的数学原理是什么呢?

2024-09-21 13:47:22 1127

原创 概念|如何根据大模型api服务定价推测云厂商让利程度?

本文从计算量、存储以及gpu的特性解释了为什么模型推理的每个token的价格要比prompt中每个token的价格更贵

2024-09-11 00:19:32 908

原创 概念|FLOPs、FLOPS还是MACs?

如何区分FLOPs、FLOPS还是MACs?

2024-09-06 00:57:10 637

原创 大模型微调|从原理到实践之lora(一)

lora原理

2024-08-27 00:07:56 894

原创 关于大模型落地的二三事

其中以固定的知识微调行业大模型为基础,在不同场景下,已有积累的问答对直接检索,需要动态更新的非结构化数据打向量数据库+rag的组合拳,针对各种数据库、结构化数据做text2sql、text2code,针对api用自然语言调api,如果还想更智能就用大模型当决策大脑把这些与能与外部交互的工具组成agent,这下智能客服、智慧XX可以先吹一波,最后为行业赋能吸引企业长期付费(少不了后续的持续优化)。当然以上无论是增量预训练、微调、偏好对齐还是rag工程优化都是有多少人工才有多少智能,高质量的数据才是核心资产。

2024-07-24 22:33:08 252

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除