自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 128倍压缩还能吊打全原文?苹果 CLaRa 彻底把 RAG 玩明白了

摘要:苹果公司提出的CLaRa框架创新性地解决了传统RAG系统在网络安全应用中的核心痛点。该框架通过SCP预训练将文档压缩为连续memory tokens,采用Straight-Through软top-k机制实现检索与生成的端到端优化,使生成器能直接指导检索器改进。实验显示其压缩率与传统RAG相当(平均44.75 vs 44.86),但仅需处理半页纸的压缩信息即可达到完整文档的响应效果。在安全场景中,CLaRa显著提升了威胁情报解析(准确率提升)、攻击链重建(秒级完成)、告警去噪(自动过滤90%噪音)等关键

2025-12-03 10:14:24 507

原创 基于AutoDL云服务器的VLLM大模型部署以及本地调用

本文介绍了使用vLLM框架在云服务器上部署大语言模型的完整流程。

2025-08-20 19:51:57 772 1

原创 Tokenizer(切词器)的不同实现算法

本文介绍了Tokenizer(分词器)在文本处理中的三种主要分词方式:Word-based(基于单词)、Character-based(基于字符)和Subword-based(基于子词),重点分析了Subword分词的不同算法。文章详细讲解了BPE(字节对编码)和WordPiece算法的实现步骤,包括初始化词汇表、统计字符对频率、合并高频字符对等过程。此外还介绍了BPE的扩展版本BBPE(字节级BPE)。最后通过"unrunning"示例展示了贪婪最长匹配优先算法在复杂词汇分词中的应用。

2025-08-15 20:21:43 838

原创 Transformer 自注意力机制

摘要:本文介绍了注意力机制及其实现过程。注意力机制通过Query、Key、Value三个向量模拟人类注意力,使模型能聚焦重要信息。文章详细讲解了单层注意力机制的计算步骤,包括词嵌入、线性变换、注意力得分计算和加权求和。随后扩展到多头注意力机制,通过并行多个注意力头从不同角度捕捉信息特征,最后拼接输出并进行线性微调。文中提供了完整的PyTorch实现代码,展示了注意力机制如何动态调整词向量表示,使模型能更灵活地处理序列数据。

2025-08-15 09:06:01 790

原创 Transformer网络结构解析

本文介绍了Transformer模型的核心架构及其关键组件。首先解释了Transformer在NLP领域的重要地位,作为BERT、GPT等大模型的基础。重点阐述了位置编码的必要性及其计算方法,层归一化技术的作用,以及编码器的核心模块组成。详细分析了掩蔽多头自注意力机制在文本生成任务中的工作原理,说明其如何通过掩码实现自回归预测。最后概述了解码器如何结合编码器信息进行序列生成。全文系统性地解析了Transformer模型的运作机制,为理解现代大语言模型提供了基础框架。

2025-08-14 19:06:33 716

原创 yolov1-v3原理解析

本文系统梳理了YOLO系列目标检测算法(v1-v3)的核心技术演进。YOLOv1首创单阶段检测框架,将目标检测转化为回归问题,实现45fps实时检测但小目标识别效果欠佳;YOLOv2引入DarkNet-19骨干网络、锚框机制和passthrough层,通过多尺度训练显著提升召回率;YOLOv3采用更深的DarkNet-53网络,结合FPN特征金字塔实现三尺度预测,有效解决小目标检测难题。三版本在保持实时性的基础上,通过网络结构优化、多尺度特征融合等技术迭代,逐步提升了检测精度和适应性,为后续目标检测算法发展

2025-08-06 16:32:33 585

原创 yolo目标检测基础知识

本文系统介绍了目标检测相关概念与技术要点。首先阐述了目标检测的核心任务(识别物体类别和位置),并对比了其与图像分类、分割的区别。详细解析了YOLO算法原理,包括单阶段检测特点、数据标注流程、评价指标(IoU、mAP等)及NMS处理机制。同时介绍了目标检测中的关键性能指标(FPS、FLOPS)和YOLO的三层网络结构(Backbone、Neck、Detection head)。通过对比单阶段和两阶段检测器的差异,全面呈现了目标检测技术体系的核心要素。

2025-07-31 19:20:52 740

原创 面试问题收集——卷积神经网络

摘要:本文介绍了卷积神经网络的基础知识,包括卷积操作原理、感受野计算、各层功能(卷积层、池化层、全连接层)的区别。重点分析了分组卷积、批量归一化等技术,并概述了LeNet、AlexNet等经典网络的发展历程。文章还解答了BN的作用、参数意义及放置位置,并指出分类任务中全连接层可用全局平均池化替代。内容涵盖卷积网络的核心概念和关键技术演变。(149字)

2025-07-28 19:50:53 781

原创 经典神经网络之LetNet

经典神经网络之LetNet

2025-07-23 09:23:20 586

原创 卷积神经网络(CNN)原理

本文介绍了卷积神经网络(CNN)的基本原理和结构。CNN由卷积层、激活函数、池化层和全连接层组成,具有局部连接、权重共享和池化三大特性。文章详细讲解了卷积层的工作机制、超参数设置和特征图尺寸计算,以及池化层的作用和类型(最大池化和平均池化)。最后以LeNet为例,给出了一个简单CNN的实现代码,展示了网络各层的参数设置和输出形状。CNN通过这种层级结构能够有效提取图像特征,是计算机视觉领域的重要模型。

2025-07-21 19:56:53 871

原创 全连接神经网络、不同激活函数和梯度下降法的区别、神经网络批量标准化

机器学习精髓:首先由前向传播计算出预测值,在由预测值经过梯度下降来调整模型参数,从而降低损失函数的误差

2025-07-19 17:01:01 771

原创 pytorch基本组件的使用以及神经网络完整训练流程介绍

本篇文章是为后续更进一步学习经典神经网络,以及更先进的技术筑基,一定要牢牢掌握,年薪百万不是梦!! 

2025-06-06 23:43:59 885

原创 pytorch基础操作

此篇主要涉及pytorch的入门内容,主要是张量的基础操作以及使用pytorch进行反向传播,最后还简要介绍了pytorch的一系列常用的基础组件,以便对后续更深层次的学习任务奠定基础。

2025-06-03 15:39:04 1128

原创 K_Means算法与DBSCAN算法的工作流程与代码复现

本篇文章我们来讲讲无监督学习中,用于聚类的K_Means算法与DBSCAN算法。

2025-05-05 14:54:51 588

原创 逻辑回归理论以及代码复现

在上一系列文章我们讲了线性回归的相关知识,回归和分类是机器学习中两种核心的任务类型,它们的根本区别在于目标变量的性质。本系列文章主要来讲讲如何应用逻辑回归来对数据进行分类。

2025-05-02 21:38:32 804

原创 模型评估方法

这一篇文章我们基于随机梯度下降分类器(一种线性分类器)来讲讲如何对模型准确度进行评估,涉及到交叉验证,混淆矩阵以及ROC曲线等内容。

2025-05-02 17:22:22 2335

原创 线性回归(二):三种梯度下降法对比以及如何通过正则化解决过拟合问题

上一篇文章讲了线性回归的基础理论以及sklearn库底层代码实现,这一篇文章我们来讲讲对于不同的梯度下降法,模型参数的更新效果有什么不同,这里列出了批量梯度下降法,随机梯度下降法和小批量梯度下降法三种,并且在文章的最后,还介绍了多项式回归以及如何通过岭回归对数据进行正则化从而降低模型过拟合风险。

2025-05-01 16:08:54 1061

原创 线性回归(一):线性回归理论以及代码复现

本文主要是讲了线性回归的一些简单的必备的理论,以及sklearn中线性回归库的底层代码复现,水平有限,不喜勿喷!

2025-04-28 15:47:24 2113

原创 图像认识与OpenCV

OpenCV学习笔记

2025-04-13 17:04:25 2207

原创 numpy,pandas,matplotlib库的使用

Python三个常用库的学习笔记。

2025-03-27 21:48:49 678

原创 将本地项目部署到Git仓库的流程

Gitee学习笔记。

2025-03-25 21:34:50 881

原创 01-二分查找

力扣刷题学习笔记和思路记录。

2025-03-22 21:09:08 939

原创 02-数组和链表

力扣刷题知识笔记和思路记录刷题指南参考:CyC2018/CS-Notes: :books: 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计知识点参考:Hello 算法。

2025-03-17 18:32:20 936

原创 Python基础语法

语言:Python(python==3.9)编译软件:VScode、PyCharm环境:Anaconda未完待续。。。

2025-03-09 17:18:19 833

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除