自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(638)
  • 资源 (3)
  • 收藏
  • 关注

原创 微软开源AI Agent AutoGen 详解

通用的AI助手,能理解用户查询并给出准确响应。:用于模拟用户行为,在测试和开发Agent交互中发挥关键作用。GroupChat:可将多个Agent分组,分组后的Agent协同工作完成特定任务。

2025-01-16 14:25:12 425

原创 AI Agent 智能体详解

是一个开源框架,用于构建AI Agent,简化了事件驱动、分布式、可扩展和弹性的Agent应用程序的创建。是一个由Toran Richards创建的流行开源项目,利用GPT4作为大脑,结合langchain的链接思想,连接各种工具和互联网资源来完成人类给予的任务。是一个基于Langchain和OpenAI基础构建的AI Agent平台,使用户能够在浏览器或个人计算机中创建、配置和部署自主AI代理。

2025-01-15 16:07:35 316

原创 Stable Video Diffusion(SVD)搭建部署

Stable Video Diffusion(SVD)是Stability AI于2023年11月21日发布的视频生成式大模型,是一种用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。该模型不仅支持文本、图像生成视频,还支持多视角渲染和帧插入提升视频帧率,用户可以调整模型选择、视频尺寸、帧率及镜头移动距离等参数。SVD模型对硬件要求较高,对缺乏硬件资源的普通用户有一定限制,且其支持的图片尺寸较小,限制了应用场景。

2025-01-14 14:39:09 269

原创 使用 Optimum Habana 在 Intel Gaudi 上加速模型训练与推理

Optimum Habana 是 Hugging Face 开发的一个开源库,旨在帮助开发者在 Intel® Gaudi® AI 加速器(HPU,Habana Processing Unit) 上高效地训练和推理大规模的机器学习模型,特别是 Transformer 和 Diffuser 模型。它作为 Hugging Face Optimum 系列工具的一部分,专注于优化模型在 Gaudi 硬件上的性能,使开发者能够更轻松地利用 Gaudi 加速器的计算能力。

2025-01-06 13:05:35 889

原创 uni-app设置页面不存在时跳转到指定页面

uni-app提供了onPageNotFound事件,可以在App.vue中监听这个事件,并在事件触发时执行跳转。

2024-12-18 14:09:07 439

原创 如何设置浏览器不缓存网页

这里expires -1;表示过期时间为过去,即告诉浏览器页面已经过期,不应该被缓存。Cache-Control响应头的no-cache、no-store和must-revalidate指令进一步强化了不缓存的要求。

2024-12-18 13:57:37 590

原创 解决matplotlib错误:“findfont: Generic family ‘sans-serif‘ not found because none of the...”

findfont: Generic family 'sans-serif' not found because none of the following families were found: SimHeiUserWarning: Glyph 19981 (\N{CJK UNIFIED IDEOGRAPH-4E0D}) missing from font(s) DejaVu Sans.

2024-12-05 14:58:44 392

原创 uni-app打包H5自定义微信分享

配置好OG标签信息后,从浏览器分享到微信时,在卡片上能正常显示标题、描述、缩略图。但是在使用微信内置分享(右上角->分享到朋友等)时,描述和缩略图没有正常显示。

2024-11-22 15:06:21 1589

原创 Python去除图像白色背景

Python使用Pillow和opencv去除图像白色背景。

2024-11-19 20:13:44 482

原创 使用diffusers和ControlNet进行文生图

Diffusers库是由Hugging Face团队推出的一款专门用于处理扩散模型(Diffusion Models)的工具箱,支持各种扩散模型的加载、训练和微调,能够生成高质量的图像、音频,此外,它还提供了多种噪声调度器,用于调节模型推理中的速度和质量。

2024-11-18 19:11:14 847

原创 解决VUE报错:“Error: ENOSPC: System limit for number of file watchers reached, watch ”

这个错误信息表明Node.js应用遇到了一个系统资源限制问题,具体来说是文件监视器(file watchers)的数量达到了系统限制。在Linux系统中,每个用户都有一个inotify实例限制,这是由内核参数fs.inotify.max_user_watches控制的。当这个限制被达到时,尝试创建新的文件监视器就会失败,并抛出ENOSPC错误。

2024-11-07 16:10:12 410

原创 使用html-docx-js-typescript将Html转换为Word文件

html-docx-js-typescript 是一个 JavaScript 库,它允许将 HTML 文档转换为 DOCX 格式的 Word 文档。通过 npm 来集成 html-docx-js-typescript,此外,由于该库在生成文件时通常会用到 Blob 对象,并且为了方便用户下载生成的 DOCX 文件,还会用到 file-saver 这个库。安装完成后,就可以在代码中使用这两个库来将 HTML 转换为 DOCX 文件了。

2024-10-31 11:17:26 577

原创 分类任务中评估模型性能的核心指标

在机器学习尤其是分类任务中,Accuracy(准确率)、Precision(精确率)、Recall(召回率)和F1 Score(F1分数)是评估模型性能的四个核心指标。

2024-10-18 18:49:19 819

原创 Clip模型详解

CLIP(Contrastive Language-Image Pre-training)是由OpenAI在2021年推出的一种基于对比学习的多模态预训练模型,它通过大规模的图像和文本数据进行训练,使得模型能够理解图像内容和相关文本之间的语义关系。这种模型能够同时理解文本和图像,可以看作是一个连接语言和视觉两种信息形式的桥梁。CLIP的核心贡献在于它打破了传统的固定类别标签范式,通过对比学习的方式,将图像和文本映射到同一个向量空间中,从而实现跨模态的检索和分类。

2024-10-16 20:20:29 1939

原创 Transformer的预训练模型

Transformer的预训练模型有很多,其中一些在自然语言处理(NLP)和计算机视觉等领域取得了巨大成功。

2024-10-16 19:39:31 1101

原创 Midjourney参数详解

Midjourney的参数是添加到提示词中的选项,用于更改图像的生成方式。这些参数可以调整图像的宽高比、风格、质量、随机性等多个方面。

2024-09-24 15:09:03 1069

原创 使用OpenCV检测图像是否是模糊的

在Python中检测照片是否模糊通常涉及图像处理技术,其中一个常用的库是OpenCV(Open Source Computer Vision Library)。检测图像模糊的一种常用方法是基于图像的锐度或边缘信息的多少。一个模糊的图像通常包含较少的边缘或高频信息。

2024-09-23 10:34:58 931

原创 Transformer 架构详解

Transformer 架构是由 Ashish Vaswani 和他的同事们在 2017 年的论文《Attention is All You Need》中首次提出的。它在自然语言处理(NLP)和其他序列建模任务中取得了前所未有的成功。Transformer 模型完全基于自注意力机制,摒弃了循环和卷积操作,这使得它在处理长序列数据时具有显著优势,并且能够实现并行化计算。

2024-09-19 19:02:49 986

原创 CNN卷积神经网络详解

卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,专门用于处理具有网格结构的数据,如图像、视频等。它在计算机视觉、自然语言处理、语音识别等领域有着广泛的应用。

2024-09-18 15:03:23 2025

原创 卷积核详解

卷积核(Convolution Kernel),简单来说,就是在进行图像处理或信号处理时,用来“扫描”或“滑动”过原始数据(比如一张图片)的一个小型矩阵。这个矩阵里面包含了一些数值,这些数值在滑动过程中与原始数据对应位置的数值进行特定的数学运算(通常是乘法后求和),从而生成新的数据或特征。

2024-09-18 12:10:57 832

原创 timm图像模型库

timm(PyTorch Image Models)是一个集合了多种SOTA(State of the Art)计算机视觉模型、层、实用工具、优化器、调度器、数据加载器、增强策略以及训练/验证脚本的库,旨在简化模型的选择、创建和微调过程。它支持超过700种预训练模型,并且可以轻松地进行加载和使用。

2024-09-14 11:15:30 1285

原创 RepLKNet架构详解

RepLKNet 通过引入大卷积核和重参数化技术,有效地结合了 Vision Transformer 的全局建模能力和 CNN 的高效计算优势。其设计创新在于既保持了卷积网络的结构简单性和计算效率,又通过大卷积核弥补了 CNN 在处理长距离依赖信息时的不足。因此,RepLKNet 是一种强大的模型架构,适用于各类计算机视觉任务,在大规模数据集上的表现尤其出色。

2024-09-12 15:48:58 923

原创 ConvNeXt架构详解

ConvNeXt 是一种现代化的卷积神经网络架构,结合了 ResNet 的经典设计和 Vision Transformer 的创新元素。通过一系列巧妙的调整和优化,ConvNeXt 证明了卷积网络在处理视觉任务时依然可以与 Transformer 相媲美,甚至在某些场景下有更好的计算效率和性能表现。

2024-09-12 15:38:23 1668

原创 DeepFake换脸检测

DeepFake(深度伪造)技术能够以惊人的准确度修改视频或图像中的人脸,造成虚假信息的快速传播。为了应对这一挑战,许多研究者开始探索防御DeepFake的技术手段。DeepFakeDefenders项目是由VisionRush团队开发的,旨在通过先进的技术手段识别和对抗DeepFake。该项目提供了一套完整的工具集,包括预训练模型、训练脚本以及部署方案,帮助用户快速构建自己的DeepFake检测系统。

2024-09-12 10:52:49 1086

原创 MySQL解决错误this is incompatible with sql_mode=only_full_group_by…

在SQL查询语句中加入group by时报了以下错误

2024-09-10 18:05:02 699

原创 解决docker启动失败的错误“Status: unknown flag: --graph”

最近服务器重启以后docker启动失败了,使用以下命令查看 Docker 的日志文件以获取更详细的错误信息。

2024-09-05 20:57:59 631

原创 ComfyUI使用Flux模型

ComfyUI是一个强大的用户界面,支持多种图像处理和生成模型,而Flux是一系列由Black Forest Labs开发的扩散模型。

2024-08-31 18:16:13 2046

原创 Python使用OpenCV识别图片人脸

在Python中,识别图片中的人脸并获取人脸区域的坐标,通常可以使用OpenCV库结合Haar特征分类器来实现。

2024-08-30 12:05:36 810

原创 PyQt5库详解

PyQt5是一个Python编程语言的GUI工具包,允许开发人员使用Python语言创建桌面应用程序。它基于Qt库,Qt是一个流行的C++框架,用于开发跨平台的应用程序。

2024-08-17 15:01:36 1497

原创 PyWin32库详解

PyWin32是一个Python库,它提供了丰富的接口以便访问Windows操作系统下的各种原生API。这个库为Python开发者在Windows平台上进行开发提供了极大的便利,使得在Python程序中使用Windows功能变得容易。

2024-08-13 20:29:57 903

原创 Deep-Live-Cam实时AI换脸

Deep-Live-Cam 是一个基于AI技术的实时人脸替换和动画工具,该项目结合了深度学习算法,能够实时地将一个选定的人脸替换到目标视频或图片中,支持多种平台和执行环境。

2024-08-13 19:52:30 2433 3

原创 AIGC生成图像检测

丰富纹理区域中的像素表现出比贫乏纹理区域中的像素更显著的波动。他们采用ResNet-50作为分类器,并观察到包括JPEG压缩和高斯模糊在内的数据增强可以提高检测器的泛化能力,这意味着检测器可以很好地泛化到未见过的架构、数据集和训练方法。LNP观察到真实图像的噪声模式在频率域中表现出相似的特征,而生成图像的噪声模式则截然不同。LGrad提取了一个训练良好的图像分类器获得的梯度图,作为GAN生成图像的指纹。基于这一观察,他们旨在通过将全局纹理提取融入常见的ResNet结构中,来提高检测器的泛化能力和鲁棒性。

2024-08-08 10:46:18 1484

原创 SpringBoot使用开发环境的application.properties

在Spring Boot项目中,application.properties 或 application.yml 文件是用于配置应用程序外部属性的重要文件。这些文件允许定制你的应用,而无需更改代码。根据不同的运行环境,可以通过创建以application-{profile}.properties格式命名的文件来定义不同环境的配置,其中{profile}是环境标识,如test(测试)、dev(开发)、prod(生产)等。

2024-07-16 19:56:19 599

原创 SpringBoot如何使用Kafka来优化接口请求的并发

在Spring Boot中使用 Kafka 来优化接口请求的并发,主要是通过将耗时的任务异步化到Kafka消息队列中来实现。这样,接口可以立即响应客户端,而不需要等待耗时任务完成。在Spring Boot应用程序中调用Kafka通常涉及使用Spring Kafka库,它提供了与Apache Kafka的高级集成,使得从Spring Boot应用程序中发送和接收消息变得更加简单和直观。

2024-07-16 18:05:06 637

原创 SpringBoot 解决 getSession().getAttribute() 在负载均衡环境下无法获取session的问题

在Spring Boot中,使用方法时遇到在负载均衡环境下无法正确获取session属性的问题,通常是由于session属性存储在单个服务器的内存中,而负载均衡会导致用户的请求被分配到不同的服务器上,因此无法找到在其他服务器上未定义的session属性。

2024-07-15 20:51:41 1036

原创 SpringBoot解决Apache Tomcat输入验证错误漏洞

ApacheTomcat 输入验证错误漏洞(CVE-2024-24549)CVE编号漏洞描述Apache Tomcat是美国阿帕奇(Apache)基金会的一款轻量级Web应用服务器。该程序实现了对Servlet和JavaServer Page(JSP)的支持。Apache Tomcat存在输入验证错误漏洞,该漏洞源于HTTP/2请求的输入验证不正确,会导致拒绝服务。修复方案目前,官方漏洞修复版本已经发布。建议用户升级到安全修复版本: 8.0.x 用户升级组件到 8.5.99 版;

2024-07-15 20:39:01 2363

原创 Java实现图像处理

在Java中,图片处理可以通过java.awt和库来完成,java.awt是 Java 标准库(Java Standard Edition, JSE)的一部分。

2024-07-12 13:15:38 336

原创 SpringBoot使用@RestController处理GET和POST请求

在Spring MVC中,@RestController注解的控制器类可以处理多种HTTP请求方法,包括GET和POST。这些请求方法通过特定的注解来映射,比如@GetMapping用于GET请求,@PostMapping用于POST请求。这些注解是@RequestMapping的特定化版本,提供了更清晰的语义。

2024-07-08 11:26:21 1135

原创 YOLOv8目标检测算法详解

YOLOv8是Ultralytics公司最新推出的Yolo系列目标检测算法,建立在Yolo系列历史版本的基础上,并引入了新的功能和改进点,以进一步提升性能和灵活性。它是实现目标检测、图像分割、姿态估计等任务的最佳选择之一。YOLOv8是一种基于深度学习的目标检测算法,其核心思想是将目标检测问题转化为一个回归问题,通过一次前向传播过程即可完成目标的位置和类别预测。它继承了YOLO系列算法的优点,如速度快、实时性好等,并在准确性和泛化能力上进行了进一步的提升。

2024-06-27 13:09:08 3506 1

原创 MySQL查询随机返回数据表的一条数据

如果你正在处理大型数据表,并需要频繁地执行此类查询,那么你可能需要考虑其他更高效的方法,比如使用一个额外的列来存储一个随机值,并在插入新记录时更新它,或者使用其他数据库特定的技术来优化随机查询。但通常,对于偶尔的随机查询,上面的方法就足够了。但是,请注意,对于大型数据表,这可能会变得非常慢,因为它需要对整个表进行随机排序。对于小型到中型的数据表,这通常是可行的。要在MySQL中随机返回数据表的一条数据,可以使用。以下是一个基本的示例,展示如何从名为。会将结果集按照随机顺序排序,然后。表中随机的一条记录。

2024-06-19 19:08:59 801

基于RoBERTa模型实现AI生成文本检测

本代码使用RoBERTa模型,我们可以有效地检测AI生成的文本。 RoBERTa(Robustly optimized BERT approach)是BERT的一个优化版本,通过对大量数据进行预训练,它在各种自然语言处理任务上都取得了显著的性能提升。 主要步骤:包括数据预处理、模型和优化器的初始化、训练过程、验证与早停机制以及评估函数。

2024-12-08

基于ViT模型实现相似图像检索

本代码基于深度学习实现图像检索,它利用Vision Transformer(ViT)模型来提取图像特征,并执行相似度比较以找到最匹配的图像。系统的核心功能是通过比较查询图像与数据库中图像的特征向量,来检索出与查询图像最相似的图像。 核心组件 预处理:图像在送入模型之前会经过一系列的预处理步骤,包括调整大小、中心裁剪、转换为张量以及归一化。 特征提取:使用预训练的Vision Transformer模型(vit_b_16)来从预处理后的图像中提取特征向量。这里假设模型的输出可以作为图像的特征表示。 余弦相似度计算:系统使用余弦相似度来衡量两个特征向量之间的相似度,这是一种常用于比较向量相似度的方法。 数据库构建:系统会遍历指定的数据集目录,对每个图像文件执行特征提取,并将特征存储在内存中以便于后续检索。 图像检索:给定一个查询图像,系统会计算其特征与数据库中每个图像特征的相似度,并返回最相似的图像列表。

2024-11-25

iOS生成二维码 QRCodeView

iOS生成二维码 QRCodeView 封装完整,可以展示二维码或者生成二维码图片,使用原生滤镜CIFilter生成二维码。

2020-10-19

iOS生物识别FaceID&TouchID

iOS的指纹识别验证与面部识别验证,调用系统的LocalAuthentication.framework,封装完整。

2020-10-19

IOS环形进度条

IOS环形进度条,可自定义环形进度条的时间、半径、颜色等等。

2014-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除