- 博客(6)
- 收藏
- 关注
转载 探秘Transformer系列之(34)--- 量化基础
虽然基于Transformer架构的LLMs已经取得了长足的发展,但由于LLMs的参数变得越来越多,部署基于Transformer的LLMs面临着重大挑战。例如,即使是中等规模的LLMs,如LLaMA13B,也需要大约26GB的内存来加载其所有参数的FP16格式。这样的开销不仅推高了使用成本,而且限制了它们的更广泛应用。为了应对这些挑战,人们提出了许多针对LLMs的专业压缩方法,包括剪枝、知识传递、量化、紧凑的架构设计以及动态网络等。
2025-06-25 12:05:35
162
转载 【对称加密】DES与AES算法详解及Java实现
对称加密是指加密和解密使用相同密钥的加密算法。高效性:比非对称加密快100-1000倍密钥管理:需要安全地共享密钥常见算法:DES、3DES、AES、Blowfish等应用场景:大数据量加密、SSL/TLS会话密钥、磁盘加密等基本流程明文 + 密钥 → 加密算法 → 密文密文 + 密钥 → 解密算法 → 明文特性DESAES密钥长度56位128/192/256位分组大小64位128位安全性已不安全目前安全性能较慢更快轮数16轮10/12/14轮。
2025-06-09 07:45:24
43
转载 模型蒸馏(Distillation)案例--从DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏
定义训练参数output_dir="./results", # 训练结果保存路径eval_strategy="epoch", # 每个 epoch 结束时评估learning_rate=5e-5, # 学习率(默认 5e-5 是常见选择)per_device_train_batch_size=2, # 每个设备的训练 batch size(GPU 单卡)
2025-05-13 17:40:50
98
转载 zk源码—5.请求的处理过程
Leader中的AckRequestProcessor处理器和Follower中的SendAckRequestProcessor处理器,最终都会触发调用Leader的processAck()方法和tryToCommit()方法,而Leader的tryToCommit()方法又会调用CommitProcessor的commit()方法进行事务提交。对于Learner转发的会话请求,虽然在Learner的会话管理器注册了会话,但还没在Leader的会话管理器中进行注册,因此需要在预处理器进行注册。
2025-05-02 10:13:03
35
转载 python map设值
Python中使用Map函数设值的完整教程 在Python编程中,map函数是一个强大的工具,可以方便地对序列中的每一个元素进行函数操作。对于刚入行的小白来说,理解和应用这个概念可能会有些困难,但只要掌握正确的流程和步骤,就能轻松上手。本文将详细讲解如何在Python中使用map函数进行设值,帮助你一步一步掌握这一技巧。 ...
2024-08-03 02:05:58
150
转载 目标检测5
这次带来目标检测新方式目标检测模型在定位和分类训练期间显示目标时表现良好,然而,由于创建和注释检测数据集的难度和成本,训练过的模型检测到数量有限的目标类型,未知目标被视为背景内容。这阻碍了传统检测器在现实应用中的采用,如大规模物体匹配、visual grounding、视觉关系预测、障碍检测(确定物体的存在和位置比找到特...
2024-07-31 02:24:20
96
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅