自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 Could not load library libcudnn_cnn_infer.so.8

使用python的segment_anything 包。

2024-01-17 14:36:02 645

原创 使用PEFT微调ChatGLM3-6B

PEFT(Parameter-Efficient Fine-Tuning)是一个库,用于有效地使大型预训练模型适应各种下游应用程序,而无需微调模型的所有参数,因为它的成本高得令人望而却步。PEFT方法仅微调少量(额外)模型参数 - 显着降低计算和存储成本 - 同时产生与完全微调模型相当的性能。这使得在消费者硬件上训练和存储大型语言模型 (LLM) 变得更加容易。

2023-12-18 15:20:24 2431 4

原创 Stable Diffusion

Stable Diffusion是一种新型的图像生成模型,这里主要参考自b站up主大白话AI,这是我迄今为止见过将讲的最清晰的,up是个人才,推荐大家去观看原视频。LoRa是大模型微调的一种基础方法,广泛应用于语言大模型、视觉大模型和Clip对齐模型。高斯噪声和原图以一定的比例混合:扩散过程中,每一步均基于上一步得到的混合噪声的图片,且每次添加的噪声均是新的高斯噪声,BeTa t逐渐增大。推导从 xt-2到 xT的推导:** 原理:** E(cX) = cE(X), D(cX) = c2。

2023-11-03 11:53:45 158

原创 no kernel image is available for excution on the device

在kernel.cu文件上右键,依次选择属性 -> 配置属性 -> CUDA C/C++ -> Device -> Code Generation,假设你的卡计算能力5.0,则设置为 == compute_52,sm_52 == 就会报上面的错误,应该设置为 == compute_50,sm_50 ==。

2023-11-02 18:55:31 723

原创 机器学习(经典)

吴恩达老师部分课程的一个总结,本篇记录机器学习比较古老但是很有效的技术。

2023-11-02 16:54:11 227

原创 LoRa实操入门

LoRa是大模型微调的一种基础方法,广泛应用于语言大模型、视觉大模型和Clip对齐模型。这里介绍的是使用LoRa来训练Stable Diffusion的流程和细节,内容来自于b站up主朱泥酱,也建议大家去看视频讲解,非常详细。

2023-11-02 11:38:48 901

原创 机器学习(流行)

吴恩达老师部分课程的一个总结,本篇记录机器学习目前比较实用的新技术。

2023-10-19 11:32:13 68

原创 分布式-算法

内存墙静态内存:模型自身权重、优化器状态动态内存:前向输出、梯度输出、算子计算的临时变量、反向传播时逐渐释放的内存通信墙片间通信、集群内通信性能墙AI芯片、AI分布式框架的运行和调度效率、分布式并行的优化手段调优墙保证计算正确性、性能、可行性、手工分布式的难度。

2023-09-03 09:58:50 109

原创 分布式-集群

参数服务器(PS)模式有一个或多个中心节点,这些节点用于聚合参数和管理模型参数。而集合通讯(CC)模式没有中心节点,每个节点不仅要负责训练,同时还需实时掌握全局梯度信息。同步与异步执行同步:等待所有节点完成梯度计算再更新网络参数。异步:不等待所有节点完成梯度,直接利用旧的网络参数来进行计算。半同步:设置一个阈值,超过这个阈值就不等了。环同步算法第一步:沿环收集数据第二步:沿环广播。

2023-08-31 00:16:47 129

原创 autogluon依赖

autogluon的依赖包

2023-05-24 20:56:40 106

原创 ChatGPT问答 ——不定期更新

2023-04-01 17:34:40 125

原创 归一化总结

常见的一些归一化方法的总结

2023-04-01 11:58:01 1423

翻译 PupilTAN: 一种Few-Shot的对抗性瞳孔定位器

本文为翻译搬砖和总结一些自己的心得体会。作者:发布于2021年眼睛中心定位是许多计算机视觉应用所面临的一个挑战性问题。阴影通常源于场景的可变性,例如,广泛的形状、照明条件、视角和遮挡。如今,对深度神经网络的兴趣与日俱增,需要大量的训练数据。然而,一个重要的问题是对标记数据的依赖性,这些数据获取成本高,容易出错。为了解决这些问题,我们提出了一个名为PupilTAN的深度网络,该网络执行图像到热图的转换,以及一个对抗性训练框架,该框架以几次无监督的方式解决眼睛定位问题。

2022-11-19 16:47:48 517

翻译 基于注意力和差异机制的基于外观的注视估计

本文为翻译搬砖和总结一些自己的心得体会。作者:发布于2021年基于外观的注视估计问题在过去几年中受到了广泛的关注。尽管基于模型的方法存在得更早,但大数据集的可用性和新颖的深度学习技术使得基于外观的方法比基于模型的方式实现了更高的准确性。在本文中,我们提出了两种提高视线估计精度的新技术。我们的第一种方法,I2D Net使用差异层来消除参与者左眼和右眼中与注视估计任务无关的任何共同特征。我们的第二种方法AGE Net采用了注意力机制的思想,并为从眼睛图像中提取的特征分配权重。

2022-11-18 17:29:38 1509 2

翻译 移动GPU上单目视频的实时人脸表面几何

本文为翻译搬砖和总结一些自己的心得体会。作者:发布于2019年我们提出了一种基于端到端神经网络的模型,用于从AR应用的单个相机输入推断人脸的近似3D网格表示。468个顶点的相对密集的网格模型非常适合基于人脸的AR效果。所提出的模型展示了移动GPU上的超实时推理速度(100–1000+FPS,取决于设备和模型变型)和高预测质量,与同一图像的手动注释的差异相媲美。通过对齐面部网格模板来预测面部几何形状的问题,也称为面部对齐或面部配准,长期以来一直是计算机视觉的基石。

2022-11-01 20:40:39 283 1

翻译 数字木偶的单目视频实时瞳孔跟踪

本文为翻译搬砖和总结一些自己的心得体会。作者:发布于2020年我们提出了一种简单、实时的方法,用于从移动设备上的实时视频中跟踪瞳孔。我们的方法用两个新组件扩展了最先进的人脸网格检测器:一个预测2D中瞳孔位置的微型神经网络,以及一个基于位移的瞳孔混合形状系数估计。我们的技术可以用于精确控制虚拟宠物的瞳孔运动,并为其注入活力和活力。建议的应用程序在现代手机上的运行速度超过50 FPS,并且可以在任何实时木偶游戏管道中使用。在实时使用人类的实况镜头中为虚拟木偶制作动画的任务是一项研究得很好的任务。

2022-10-30 18:05:22 319

翻译 在桌面环境中使用网络摄像头进行眼睛注视跟踪

本文为翻译搬砖和总结一些自己的心得体会。作者:Yiu-ming Cheung;Qinmu Peng,发布于2015年本文使用低成本、更方便的网络摄像机在桌面环境中解决视线跟踪问题,而不是使用需要特定硬件的视线跟踪技术,例如红外高分辨率摄像机和红外光源,以及繁琐的校准过程。在该方法中,我们首先在实时视频序列中跟踪人脸以提取眼睛区域。然后,我们将强度能量和边缘强度相结合来获得虹膜中心,并利用分段眼角检测器来检测眼角。

2022-10-28 22:26:45 1547

翻译 人眼跟踪技术综述

本文为翻译搬砖和总结一些自己的心得体会。作者:发布于2013年眼动研究正被用于人机交互(HCI)研究。视线跟踪是计算机视觉领域中最具挑战性的问题之一。本文的目的是对远程视线跟踪这一持续发展的最新研究进行综述。本概述包括基本定义和术语、该领域的最新进展以及该领域未来发展的需要。关键词:远程视线跟踪,单摄像机和多摄像机眼动仪,视频眼动仪。脸是心灵的指标,眼睛是心灵的窗口。眼动提供了一个丰富的信息窗口,可以了解一个人的思想和意图。因此,对眼球运动的研究可以根据人们的视线位置来确定他们在想什么。

2022-10-27 11:45:44 1714

翻译 交互式应用中的视线跟踪技术

本文为翻译搬砖和总结一些自己的心得体会。作者:Carlos H.MorimotoMarcio R.M.Mimica,发布于2005年本文综述了视线跟踪技术,并重点介绍了可能有助于其在一般计算机应用中应用的最新进展。早期的视线跟踪设备适合在受控环境中进行科学探索。尽管长期以来人们一直认为它们也有可能成为重要的计算机输入设备,但这项技术仍然缺乏重要的可用性要求,这阻碍了其适用性。由于其声称的可用性优势,我们对瞳孔-角膜反射技术进行了详细描述,并表明该方法仍然不适合于一般交互式应用。

2022-10-26 19:02:29 1454

原创 QT python

pyside2使用designer设计界面

2022-08-11 19:26:50 2863

原创 OpenCV python

opencv python篇

2022-07-26 21:56:42 1424

原创 cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案

cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案

2022-05-14 22:56:01 4161

原创 NodeJS学习

Node.js欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markd

2022-03-04 22:26:18 465

原创 C语言错误总结:request for member ‘xxx’ in something not a structure or union

先上代码:struct complex{ double a,b;};//判断是否收敛int isConvergent(double x,double y){ int i;double a,b; struct complex Z; Z.a=Z.b=0.0; for(i=1;i<=666;++i){ a=Z.a;b=Z.b; Z.a=a*a-b*b;Z.b=2*a*b; Z.a+=x;Z.b+=y; if(Z.

2021-12-09 22:59:24 7262 1

原创 用pyhtml2pdf(python)包自动从html生成pdf

用pyhtml2pdf(python)包自动从html生成pdf1.pyhtml2pdf的使用代码示例:运行代码需要先安装拓展库:pip install pyhtml2pdf更多详情,请参见官网:https://www.cnpython.com/pypi/pyhtml2pdf2.基于pyhtml2pdf的拓展我们使用发现pyhtml2pdf并没有提供生成pdf格式的选项,这里我们基于其代码进行拓展:myconcerter.py:import pyhtml2pdfdef conve

2021-11-14 00:03:57 3135

原创 Selenium自动化测试——练气期

Java Selenium-Web自动化测试一、软件和环境1.安装ideahttps://www.exception.site/essay/how-to-free-use-idea-202021-by-resigter-code?ivk_sa=1024320u2.建立maven项目maven中央镜像网站->搜索selenium->进入selenium-java选取合适版本,复制maven镜像到项目中的pom.xml中。搜索testng->选取合适版本,复制maven镜像到项

2021-11-04 22:28:12 419

原创 并行编程——mpi

mpi函数mpi初始化int MPI_Init(int *argc, char ***argv);mpi程序结束int MPI_Finalize(void);获取当前进程标识int MPI_Comm_rank(MPI_Comm comm, int *rank);IN comm 该进程所在的通信域 句柄OUT rank 调用进程在comm中的标识号获取通信域内的进程数int MPI_Comm_size(MPI_Comm comm, int *size);IN com

2021-10-05 20:54:24 1237

原创 并行编程——Foster设计方法

Foster设计方法定义Foster四步1. 划分2. 通信3. 聚集4.映射定义Foster设计方法由lan Foster提出,它是一个由四步构成的并行算法设计过程。Foster设计方法中的四步为划分、通信、聚集和映射。Foster四步1. 划分为了发现并行算法的更多并行性,需要将计算和数据划分成许多小片。域分解是一种并行程序设计方法,我们通常考虑程序中最大和最频繁访问的数据,先将数据分解成片,再考虑将计算和数据联系起来。功能分解为域分解的补充策略。功能分解常常生成通过流水实现并发的任务的集

2021-10-03 17:53:00 1635

原创 Linux基础手册

Linux 学习记录(1-37,63-75)学习环境: VMware 15.0.4、CentOS 6.3VMware下载安装(密钥激活)CentOS下载创建空白虚拟机,配置常用虚拟机设置参数:内存大小:[625M,真实内存的一半],默认1G;处理器:根据真实情况分配,真实机和虚拟机可共用处理器,可以分配真实机最大处理器配置;硬盘:根据需要来进行扩增;CD/DVD(IDE):指定CentOS的iso映像文件路径。...

2021-09-11 17:52:17 436

原创 MySQL基础操作总结

MySQL基础操作总结一. 常见函数1.字符函数2.数学函数3.日期函数4.其它函数5.流程控制函数6.分组函数:统计使用二.查询1.条件查询3.排序查询4.分组查询5.多表查询6.子查询:出现在其它语句中的select语句7.分页查询:分页显示时使用 limit 开始条目(从0开始),条目个数8.联合查询一. 常见函数1.字符函数(1)length(str):字节长度 select length('rose');#4 select length('张三');#2 show variables

2021-03-22 18:33:45 137

原创 有关数据库规范化的问题总结

有关数据库规范化的问题总结1.某属性集在依赖集上求闭包2.函数依赖集的最小依赖集合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1.某属性集在依赖集上求闭包问题描述:已知关系模式R<U,F>,其中U={A,B,C,D,E},

2021-03-19 15:22:23 587

原创 Android OpenGL动态壁纸问题总结

打开动态壁纸时一直显示动态壁纸正在加载报错信息: 无!(这是最难受的 /(ㄒoㄒ)/~~ )。问题原因: 粗心导致!把本应返回的MyEngine类写成了Engine。问题代码块:public class MyGLWallpaperService extends WallpaperService { @Override public Engine onCreateEngine() { return new Engine();//<-------------.

2020-05-25 18:08:09 637

原创 在导入新的android项目时关于gradle问题的一些总结

问题1. 导入别的项目时出现Could not resolve all artifacts for configuration ‘:classpath’. 报错首先百度翻译得其中文意思:无法解析配置“:classpath”的所有项目。然后,我猜错误中出现的classpath即是build.gradle文件中的那个classpath,如下图所示:dependencies { c...

2020-03-12 18:05:31 1030

原创 win10下pip升级报错的解决办法(结合各位大佬以及自身经历总结的经验)

(前提:要配置好python路径,百度即可,此处不做过多解释)1.在Python\Lib\site-packages目录下删除原版本pip文件夹(例如:pip-7.1.1.dist-info)2.以管理员身份运行cmd3.键入python -m ensurepip**命令4.键入python -m pip install --upgrade pip命令等待下载即可.。。。。...

2019-05-23 00:29:01 1391 1

cudnn,适用于cuda11.6、windows、64位系统,内置cudnn64_8.dll

注意这里的版本!!! 使用方法: 将bin、include里面的文件分别复制到“C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6”对应bin、include里面,将lib文件中的文件复制到“C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\lib\x64”中,32位的系统就放到Win32中。

2022-08-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除