- 博客(4)
- 收藏
- 关注
原创 基于深度学习的验证码识别:6 种高效数据构建策略对比与实践
本文介绍了获取验证码训练数据的4种实用方法:1)纯手工标注(精准但耗时);2)利用打码平台API(高效但需付费);3)代码自动生成(量大但可能失真);4)真实素材拼贴(平衡真实性与数量)。每种方法均附具体实现代码,适用于不同场景需求,帮助解决验证码识别项目中最关键的数据采集难题。
2026-02-26 21:12:08
829
原创 DeepSeek 论文学习笔记:从 Transformer 到 671B MoE 的技术全景解析
本文系统梳理了DeepSeek系列大模型的创新演进历程。从DeepSeek LLM的基础架构开始,介绍了其采用的RoPE位置编码、SwiGLU激活函数和RMSNorm等关键技术。随后重点分析了DeepSeekMath在MoE架构和GRPO强化学习算法上的突破,以及DeepSeek-V2提出的MLA注意力机制如何解决KV Cache显存瓶颈问题。全文通过"白话解释"与"技术深潜"相结合的方式,深入浅出地阐述了这些创新技术的原理与价值,展现了DeepSeek如何通过架构创
2026-02-25 15:32:19
990
原创 从大模型到轻量化部署:模型蒸馏技术解析与实战(同盾识别模型蒸馏)
深度学习模型蒸馏技术及应用 摘要:针对当前AI领域大模型资源消耗高、难以部署到边缘设备的问题,本文介绍了模型蒸馏技术。该技术通过"师生范式"将大模型(教师)的知识迁移到小模型(学生)中,实现模型轻量化。核心原理是利用软标签传递"暗知识",包括结果蒸馏、特征蒸馏和关系蒸馏三种形式。文中详细阐述了温度系数的调节作用,并给出了YOLOv8模型蒸馏的实战代码实现,通过KL散度损失函数实现知识迁移,在保持模型轻量化的同时提升小模型性能。
2026-01-21 17:51:46
582
1
原创 基于孪生网络 (Siamese Network) 破解 FunCaptcha 相似度验证码识别
本文介绍了一种基于孪生网络的FunCaptcha验证码识别系统。该系统通过四个关键步骤实现:首先对原始验证码图片进行自动切分和去黑边预处理;然后利用可视化标注工具快速构建训练数据集;接着采用ResNet18作为骨干网络,结合Triplet Loss训练模型学习图像相似度;最后通过计算特征向量距离实现验证码识别。该方法突破了传统分类模型的局限,有效解决了FunCaptcha验证码因类别无限和比对逻辑带来的挑战。实验表明,该系统具有较高的识别准确率和实用价值。
2026-01-05 16:10:56
1354
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅