自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 探秘Transformer系列之(34)--- 量化基础

虽然基于Transformer架构的LLMs已经取得了长足的发展,但由于LLMs的参数变得越来越多,部署基于Transformer的LLMs面临着重大挑战。例如,即使是中等规模的LLMs,如LLaMA13B,也需要大约26GB的内存来加载其所有参数的FP16格式。这样的开销不仅推高了使用成本,而且限制了它们的更广泛应用。为了应对这些挑战,人们提出了许多针对LLMs的专业压缩方法,包括剪枝、知识传递、量化、紧凑的架构设计以及动态网络等。

2025-06-25 12:05:35 162

转载 【对称加密】DES与AES算法详解及Java实现

对称加密是指加密和解密使用相同密钥的加密算法。高效性:比非对称加密快100-1000倍密钥管理:需要安全地共享密钥常见算法:DES、3DES、AES、Blowfish等应用场景:大数据量加密、SSL/TLS会话密钥、磁盘加密等基本流程明文 + 密钥 → 加密算法 → 密文密文 + 密钥 → 解密算法 → 明文特性DESAES密钥长度56位128/192/256位分组大小64位128位安全性已不安全目前安全性能较慢更快轮数16轮10/12/14轮。

2025-06-09 07:45:24 43

转载 模型蒸馏(Distillation)案例--从DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏

定义训练参数output_dir="./results", # 训练结果保存路径eval_strategy="epoch", # 每个 epoch 结束时评估learning_rate=5e-5, # 学习率(默认 5e-5 是常见选择)per_device_train_batch_size=2, # 每个设备的训练 batch size(GPU 单卡)

2025-05-13 17:40:50 98

转载 zk源码—5.请求的处理过程

Leader中的AckRequestProcessor处理器和Follower中的SendAckRequestProcessor处理器,最终都会触发调用Leader的processAck()方法和tryToCommit()方法,而Leader的tryToCommit()方法又会调用CommitProcessor的commit()方法进行事务提交。对于Learner转发的会话请求,虽然在Learner的会话管理器注册了会话,但还没在Leader的会话管理器中进行注册,因此需要在预处理器进行注册。

2025-05-02 10:13:03 35

转载 python map设值

Python中使用Map函数设值的完整教程 在Python编程中,map函数是一个强大的工具,可以方便地对序列中的每一个元素进行函数操作。对于刚入行的小白来说,理解和应用这个概念可能会有些困难,但只要掌握正确的流程和步骤,就能轻松上手。本文将详细讲解如何在Python中使用map函数进行设值,帮助你一步一步掌握这一技巧。 ...

2024-08-03 02:05:58 150

转载 目标检测5

这次带来目标检测新方式目标检测模型在定位和分类训练期间显示目标时表现良好,然而,由于创建和注释检测数据集的难度和成本,训练过的模型检测到数量有限的目标类型,未知目标被视为背景内容。这阻碍了传统检测器在现实应用中的采用,如大规模物体匹配、visual grounding、视觉关系预测、障碍检测(确定物体的存在和位置比找到特...

2024-07-31 02:24:20 96

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除