saoqi_boy-CSDN博客

原创模型蒸馏方法全总结：从经典到前沿的技术全景

经过上述系统梳理，我们可以从多个维度对各类蒸馏方法进行横向对比。表3：模型蒸馏方法多维度对比总览分类维度方法类型核心思想代表工作适用场景知识类型响应蒸馏模仿最终输出分类任务知识类型特征蒸馏对齐中间层特征检测、分割知识类型关系蒸馏学习样本/特征关系RKD、FSP蒸馏NLP、图学习蒸馏机制离线蒸馏教师先训、学生后学经典KD范式通用场景蒸馏机制在线蒸馏师生同步更新无现成教师模型蒸馏机制自蒸馏自身深层指导浅层数据自蒸馏模型自优化访问模式白盒蒸馏。

2026-04-21 11:50:46 443

原创安装Detectron2的报错解决

那么可能是 setuptools 版本过高或过低，可能会导致安装过程出错。博主通过降低 setuptools 版本到 69.0.0 成功解决。修改detectron2/layers/csrc/nms_rotated/nms_rotated_cuda.cu文件中的内容。否则，需要检查 torch 是否被正确安装。若成功导入 torch，打印。

2025-12-17 10:10:00 384

原创 Could not load library libcudnn_cnn_infer.so.8

使用python的segment_anything 包。

2024-01-17 14:36:02 1044

原创使用PEFT微调ChatGLM3-6B

PEFT（Parameter-Efficient Fine-Tuning）是一个库，用于有效地使大型预训练模型适应各种下游应用程序，而无需微调模型的所有参数，因为它的成本高得令人望而却步。PEFT方法仅微调少量（额外）模型参数 - 显着降低计算和存储成本 - 同时产生与完全微调模型相当的性能。这使得在消费者硬件上训练和存储大型语言模型（LLM）变得更加容易。

2023-12-18 15:20:24 3251 6

原创 Stable Diffusion

Stable Diffusion是一种新型的图像生成模型，这里主要参考自b站up主大白话AI，这是我迄今为止见过将讲的最清晰的，up是个人才，推荐大家去观看原视频。LoRa是大模型微调的一种基础方法，广泛应用于语言大模型、视觉大模型和Clip对齐模型。高斯噪声和原图以一定的比例混合：扩散过程中，每一步均基于上一步得到的混合噪声的图片，且每次添加的噪声均是新的高斯噪声，BeTa t逐渐增大。推导从 xt-2到 xT的推导：** 原理：** E(cX) = cE(X), D(cX) = c2。

2023-11-03 11:53:45 303

原创 no kernel image is available for excution on the device

在kernel.cu文件上右键，依次选择属性 -> 配置属性 -> CUDA C/C++ -> Device -> Code Generation，假设你的卡计算能力5.0，则设置为 == compute_52,sm_52 == 就会报上面的错误，应该设置为 == compute_50,sm_50 ==。

2023-11-02 18:55:31 1176

原创机器学习(经典)

吴恩达老师部分课程的一个总结，本篇记录机器学习比较古老但是很有效的技术。

2023-11-02 16:54:11 342

原创 LoRa实操入门

LoRa是大模型微调的一种基础方法，广泛应用于语言大模型、视觉大模型和Clip对齐模型。这里介绍的是使用LoRa来训练Stable Diffusion的流程和细节，内容来自于b站up主朱泥酱，也建议大家去看视频讲解，非常详细。

2023-11-02 11:38:48 2166

原创机器学习(流行)

吴恩达老师部分课程的一个总结，本篇记录机器学习目前比较实用的新技术。

2023-10-19 11:32:13 161

原创分布式-算法

内存墙静态内存：模型自身权重、优化器状态动态内存：前向输出、梯度输出、算子计算的临时变量、反向传播时逐渐释放的内存通信墙片间通信、集群内通信性能墙AI芯片、AI分布式框架的运行和调度效率、分布式并行的优化手段调优墙保证计算正确性、性能、可行性、手工分布式的难度。

2023-09-03 09:58:50 247

原创分布式-集群

参数服务器（PS）模式有一个或多个中心节点，这些节点用于聚合参数和管理模型参数。而集合通讯（CC）模式没有中心节点，每个节点不仅要负责训练，同时还需实时掌握全局梯度信息。同步与异步执行同步：等待所有节点完成梯度计算再更新网络参数。异步：不等待所有节点完成梯度，直接利用旧的网络参数来进行计算。半同步：设置一个阈值，超过这个阈值就不等了。环同步算法第一步：沿环收集数据第二步：沿环广播。

2023-08-31 00:16:47 469

原创 autogluon依赖

autogluon的依赖包

2023-05-24 20:56:40 329 1

原创 ChatGPT问答 ——不定期更新

2023-04-01 17:34:40 207

原创归一化总结

常见的一些归一化方法的总结

2023-04-01 11:58:01 1908

翻译 PupilTAN: 一种Few-Shot的对抗性瞳孔定位器

本文为翻译搬砖和总结一些自己的心得体会。作者：发布于2021年眼睛中心定位是许多计算机视觉应用所面临的一个挑战性问题。阴影通常源于场景的可变性，例如，广泛的形状、照明条件、视角和遮挡。如今，对深度神经网络的兴趣与日俱增，需要大量的训练数据。然而，一个重要的问题是对标记数据的依赖性，这些数据获取成本高，容易出错。为了解决这些问题，我们提出了一个名为PupilTAN的深度网络，该网络执行图像到热图的转换，以及一个对抗性训练框架，该框架以几次无监督的方式解决眼睛定位问题。

2022-11-19 16:47:48 848

翻译基于注意力和差异机制的基于外观的注视估计

本文为翻译搬砖和总结一些自己的心得体会。作者：发布于2021年基于外观的注视估计问题在过去几年中受到了广泛的关注。尽管基于模型的方法存在得更早，但大数据集的可用性和新颖的深度学习技术使得基于外观的方法比基于模型的方式实现了更高的准确性。在本文中，我们提出了两种提高视线估计精度的新技术。我们的第一种方法，I2D Net使用差异层来消除参与者左眼和右眼中与注视估计任务无关的任何共同特征。我们的第二种方法AGE Net采用了注意力机制的思想，并为从眼睛图像中提取的特征分配权重。

2022-11-18 17:29:38 2323 3

翻译移动GPU上单目视频的实时人脸表面几何

本文为翻译搬砖和总结一些自己的心得体会。作者：发布于2019年我们提出了一种基于端到端神经网络的模型，用于从AR应用的单个相机输入推断人脸的近似3D网格表示。468个顶点的相对密集的网格模型非常适合基于人脸的AR效果。所提出的模型展示了移动GPU上的超实时推理速度（100–1000+FPS，取决于设备和模型变型）和高预测质量，与同一图像的手动注释的差异相媲美。通过对齐面部网格模板来预测面部几何形状的问题，也称为面部对齐或面部配准，长期以来一直是计算机视觉的基石。

2022-11-01 20:40:39 529 1

翻译数字木偶的单目视频实时瞳孔跟踪

本文为翻译搬砖和总结一些自己的心得体会。作者：发布于2020年我们提出了一种简单、实时的方法，用于从移动设备上的实时视频中跟踪瞳孔。我们的方法用两个新组件扩展了最先进的人脸网格检测器：一个预测2D中瞳孔位置的微型神经网络，以及一个基于位移的瞳孔混合形状系数估计。我们的技术可以用于精确控制虚拟宠物的瞳孔运动，并为其注入活力和活力。建议的应用程序在现代手机上的运行速度超过50 FPS，并且可以在任何实时木偶游戏管道中使用。在实时使用人类的实况镜头中为虚拟木偶制作动画的任务是一项研究得很好的任务。

2022-10-30 18:05:22 614

翻译在桌面环境中使用网络摄像头进行眼睛注视跟踪

本文为翻译搬砖和总结一些自己的心得体会。作者：Yiu-ming Cheung;Qinmu Peng，发布于2015年本文使用低成本、更方便的网络摄像机在桌面环境中解决视线跟踪问题，而不是使用需要特定硬件的视线跟踪技术，例如红外高分辨率摄像机和红外光源，以及繁琐的校准过程。在该方法中，我们首先在实时视频序列中跟踪人脸以提取眼睛区域。然后，我们将强度能量和边缘强度相结合来获得虹膜中心，并利用分段眼角检测器来检测眼角。

2022-10-28 22:26:45 2961 1

翻译人眼跟踪技术综述

本文为翻译搬砖和总结一些自己的心得体会。作者：发布于2013年眼动研究正被用于人机交互（HCI）研究。视线跟踪是计算机视觉领域中最具挑战性的问题之一。本文的目的是对远程视线跟踪这一持续发展的最新研究进行综述。本概述包括基本定义和术语、该领域的最新进展以及该领域未来发展的需要。关键词：远程视线跟踪，单摄像机和多摄像机眼动仪，视频眼动仪。脸是心灵的指标，眼睛是心灵的窗口。眼动提供了一个丰富的信息窗口，可以了解一个人的思想和意图。因此，对眼球运动的研究可以根据人们的视线位置来确定他们在想什么。

2022-10-27 11:45:44 2868

翻译交互式应用中的视线跟踪技术

本文为翻译搬砖和总结一些自己的心得体会。作者：Carlos H.MorimotoMarcio R.M.Mimica，发布于2005年本文综述了视线跟踪技术，并重点介绍了可能有助于其在一般计算机应用中应用的最新进展。早期的视线跟踪设备适合在受控环境中进行科学探索。尽管长期以来人们一直认为它们也有可能成为重要的计算机输入设备，但这项技术仍然缺乏重要的可用性要求，这阻碍了其适用性。由于其声称的可用性优势，我们对瞳孔-角膜反射技术进行了详细描述，并表明该方法仍然不适合于一般交互式应用。

2022-10-26 19:02:29 2255

原创 QT python

pyside2使用designer设计界面

2022-08-11 19:26:50 3275

原创 OpenCV python

opencv python篇

2022-07-26 21:56:42 1956

原创 cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案

cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案

2022-05-14 22:56:01 4693

原创 NodeJS学习

Node.js欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markd

2022-03-04 22:26:18 602

saoqi_boy的博客

原创模型蒸馏方法全总结：从经典到前沿的技术全景

原创安装Detectron2的报错解决

原创 Could not load library libcudnn_cnn_infer.so.8

原创使用PEFT微调ChatGLM3-6B

原创 Stable Diffusion

原创 no kernel image is available for excution on the device

原创机器学习(经典)

原创 LoRa实操入门

原创机器学习(流行)

原创分布式-算法

原创分布式-集群

原创 autogluon依赖

原创 ChatGPT问答 ——不定期更新

原创归一化总结

翻译 PupilTAN: 一种Few-Shot的对抗性瞳孔定位器

翻译基于注意力和差异机制的基于外观的注视估计

翻译移动GPU上单目视频的实时人脸表面几何

翻译数字木偶的单目视频实时瞳孔跟踪

翻译在桌面环境中使用网络摄像头进行眼睛注视跟踪

翻译人眼跟踪技术综述

翻译交互式应用中的视线跟踪技术

原创 QT python

原创 OpenCV python

原创 cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案

原创 NodeJS学习

原创 C语言错误总结：request for member ‘xxx’ in something not a structure or union

原创用pyhtml2pdf（python）包自动从html生成pdf

原创 Selenium自动化测试——练气期

原创并行编程——mpi

原创并行编程——Foster设计方法

原创 Linux基础手册

原创 MySQL基础操作总结

原创有关数据库规范化的问题总结

原创 Android OpenGL动态壁纸问题总结

原创在导入新的android项目时关于gradle问题的一些总结

原创 win10下pip升级报错的解决办法（结合各位大佬以及自身经历总结的经验）

cudnn，适用于cuda11.6、windows、64位系统，内置cudnn64_8.dll

空空如也