自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 什么是hook函数?

在深度学习和机器学习中,hook函数是一种用于在特定事件发生时执行自定义操作的机制。通俗一点讲,Hook钩子能在执行目标代码之前或之后,拦截数据或者执行逻辑,先执行自己插入的一段代码,然后再执行后续的代码。

2024-09-02 21:20:48 570

原创 Yolov8环境配置

【代码】Yolov8环境配置。

2024-08-26 20:51:34 108

原创 ubuntu使用VM创建windows虚拟环境过程中强制关机导致显示器无法显示

ubuntu使用VM创建windows虚拟环境过程中强制关机导致显示器无法显示,nouveau驱动故障。

2024-08-24 00:42:51 160

原创 ubuntu22.04由于挂载故障导致开机后显示器黑屏

由于写入错误挂载信息到/etc/fstab导致服务器开机即进入紧急状态,但由于nouveau驱动故障导致显示器无法显示,紧急状态下无法通过键盘操作。

2024-08-24 00:35:58 421

原创 Linux JAVA环境配置经验总结【排雷】

在VScode环境下执行Java程序需要手动javac编译,但是 执行 | Debug 请点击 Run | Debug ,使用java命令运行会让你怀疑人生。: 面向开发者,提供编译、调试和运行 Java 程序所需的全部工具和环境。: 面向最终用户,提供运行 Java 程序所需的最小环境。Linux JAVA环境配置经验总结【排雷】Linux JAVA环境配置经验总结【排雷】javac xxx.java 【编译】java xxx 【执行】JDK和JRE的区别。

2024-07-03 18:21:53 270

原创 脚本控制鼠标点击达8.5cps

【代码】脚本控制鼠标点击达8.5cps。

2023-08-25 10:05:51 326 1

原创 爬树的甲壳虫

爬树的甲壳虫关键字:概率DP;数论(递推推导,费马定理);快速幂;问题描述问题分析概率DP递推公式:① 有的概率会滑落回位置,这样之后从位置开始到达树顶端的平均时间即 ;② 有的概率停留在位置i + 1,此时状态变为了从位置 到树顶端的平均时间递推公式化简:问题转换给定的计算式,,求 , 为所取的模,题目给定的M为质数。子问题根据费马小定理:如果p是一个质数,而整数a不是p的倍数,则有。除法逆元化简公式:快速幂(将计算幂值的时间复杂度从O(n)降低到O(nlogn)

2022-11-14 21:05:25 293 1

原创 使用VirtualBox快速安装Ubuntu并安装增强功能

使用VirtualBox安装Ubuntu并设置增强功能

2022-10-11 14:13:51 522

原创 Linux Shell 笔记

Linux命令行与Shell编程笔记

2022-05-13 23:56:23 415 2

蓝桥杯2022年省赛A组题目解析

这份文档是关于2022年省赛编程题目的刷题指南,内容包括以下几个部分: 洛谷基础博弈论题:介绍了博弈论的核心原理,即必胜态和必败态的转换关系。 C++二分查找的简单写法:虽然文档中没有提供具体的代码示例,但提到了二分查找作为一种算法技巧。 报名截止时间:提醒参赛者注意报名的截止日期是12月15日。 OI题目教程:建议参赛者通过做DP(动态规划)题目来提升解题能力。 A题目:裁纸刀:提供了一个题目的直觉解题思路,指出编程题目通常在想到解题点后实现会比较简单,并给出了一个具体题目的解题思路和答案。 B题:提供了一个博弈论问题的C++代码实现,包括状态的初始化和深度优先搜索(DFS)算法的应用。 求和【计算题】:讨论了如何通过求前缀和来降低计算次数,从而优化算法效率,并给出了相应的C++代码示例。 D选数异或:讨论了如何使用哈希映射优化查询效率,并通过构建最小区间集合来解决问题,同样提供了C++代码示例。 E题目:提到了“爬树的甲壳虫”问题,暗示这是一个关于期望和概率DP的难题。

2024-08-26

python实现基本的数据结构

这份文档是关于Python中使用基本数据结构的教程,涵盖了以下主要内容: 数组:介绍了数组的初始化、增加、删除、修改、查询、长度获取、排序以及最大值、最小值和总和的获取方法。 链表:包括使用collections.deque进行链表操作的方法,以及如何手动实现链表类,包括插入、删除、打印等操作。 栈:使用列表和collections.deque来模拟栈的操作,包括入栈(push)、出栈(pop)、查看栈顶元素(peek)和栈的大小。 队列:使用列表和collections.deque来模拟队列的操作,包括入队(enqueue)、出队(dequeue)、查看队首元素(peek)和队列的大小。 哈希表:通过一个简单的哈希表类HashTable来演示如何实现基本的哈希表操作,如插入、获取、删除、检查键是否存在以及获取键和值的列表。 集合:介绍了集合的初始化、增加元素、删除元素和查询元素是否存在的方法。 二叉树:包括自定义二叉树节点类TreeNode和使用数组实现树的方法,以及二叉搜索树BinarySearchTree的实现,包括插入、搜索和删除操作。 ...

2024-08-26

典型题目:优先队列+集合+字典;排序+二分查找;图论;线段树

典型题目:优先队列+集合+字典;排序+二分查找;图论;线段树;

2024-08-24

视频⽣成的初探及其可行性研究.pdf

图像生成到视频生成的“路线之争”:介绍了图像生成技术的发展历程,从早期的GAN到Diffusion模型,并讨论了文本到图像的生成技术,如DALL·E和CLIP模型。 视频生成的探索及Mini-Sora (Mira) 的初步研究:分享了作者在视频生成领域的探索经验,包括对Sora模型的理解,以及Mini-Sora (Mira) 的研究进展。 可控、编辑与应用:探讨了基于视频生成基础模型的可控性、编辑性以及应用潜力,包括空间控制、概念控制、风格控制等。 研究经验总结-HandyEXP:作者分享了自己在研究过程中的经验和心得,包括对当前技术趋势的见解和对未来研究方向的展望。 视频生成技术路线:讨论了视频生成技术的不同发展路线,包括预测未来帧的方法、GAN时代的视频生成、Diffusion时代的视频生成等。 从图像到视频的初步探索:介绍了作者团队在将图像模型应用于视频生成的初步尝试,包括Tune-A-Video项目和ST-Atten方法。 VideoCrafter系列:展示了基于Stable Diffusion的视频生成模型VideoCrafter系列的研究和开发成果。

2024-08-24

开放词汇视觉感知综述pdf

这份PDF文档是关于开放词汇视觉感知的报告。报告内容涵盖了以下几个主要部分: 课题背景介绍:介绍了视觉感知模型的发展,从2014年的Vgg到2017年的DenseNet、Transformer,指出了传统视觉模型在封闭概念空间的限制,并提出了开放场景中的挑战。 开放词汇分类:探讨了如何使用大规模图像-文本对数据来训练模型,使其能够处理开放词汇的视觉分类任务,包括零样本学习、少样本学习和开集识别。 开放词汇检测:讨论了开放词汇目标检测的挑战和方法,包括从自然图文对数据中获取知识,以及如何通过迁移学习和知识蒸馏来提升检测性能。 开放词汇分割:介绍了开放词汇分割技术,包括像素级和区域级图文匹配方法,以及如何通过视觉-语言模型来提升分割精度。 多模态大模型:分析了大规模视觉-语言预训练模型的出现如何推动开放词汇视觉感知的研究,并探讨了如何利用大模型来处理开放词汇任务。 下游任务应用:讨论了开放词汇视觉感知技术在多目标跟踪、3D实例分割、场景图生成、视觉语言导航等下游任务中的应用。

2024-08-24

场景文本识别相关文章综述

这个PPT提供了关于场景文本识别(Scene Text Recognition, STR)领域的研究进展的综述。以下是对PPT内容的总结: 字符矫正: 论文《MORAN: A Multi-Object Rectified Attention Network for Scene Text Recognition》介绍了一种多对象矫正注意力网络,能够将旋转或扭曲的文本图像矫正成正常状态。 字符定位: 论文《Scene Text Recognition from Two-Dimensional Perspective》提出了一种基于字符注意力模块和可变形卷积的网络,用于提高对字符扭曲和旋转的适应性。 数据增强: 论文《Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition》提出了一种可训练的数据增强方法,该方法能够朝着网络更难识别的方向进行增强。......

2024-08-24

MindSpore中部分hook函数实现流程解析

这个PPT主要介绍了在MindSpore框架中实现基于hook函数的模型结构,以及与PyTorch框架中hook函数的对标实现。以下是对PPT内容的总结: 基于hook函数的模型结构:介绍了使用hook函数来修改或扩展模型的行为。 基本完成需求1: 调研了MindSpore的hook函数原理实现。 增加了对标PyTorch的register_load_state_dict_post_hook和register_state_dict_pre_hook函数,以熟悉MindSpore框架流程。 对标PyTorch的register_load_state_dict_post_hook函数实现: 描述了PyTorch中该函数的作用,即在模块的load_state_dict方法调用之后执行自定义逻辑。 介绍了钩子函数的参数和作用,包括如何处理加载参数时的缺失或多余键。 说明了如何通过钩子避免在严格模式下抛出错误。 提供调用register_load_state_dict_post_hook函数的接口:介绍了如何在MindSpore中实现和调用这个接口。 在load_param_into_

2024-08-24

SAM-Based相关论文简介

这个PPT介绍了基于SAM(Segment Anything Model)的一系列工作,包括分层文本分割、交互式分割与识别、模型结合、框架结构以及一些应用场景。以下是对PPT内容的总结: Hi-SAM模型:一个统一的分层文本分割模型,能够在笔画、字、文本行和段落四个层次上进行文本分割,并实现布局分析。 Self-prompting Module:将图像特征转换为包含文本位置和上下文信息的prompt tokens。 S-Decoder:改进的SAM mask Decoder,用于生成文本笔画的掩码。 Open-Vocabulary SAM(OV-SAM):一种新型视觉模型,结合了SAM的分割能力和CLIP的零样本识别能力,用于交互式分割和识别任务。 模型结合方式:介绍了两种结合SAM和CLIP模型的方式:Image Cropping和Feature Cropping。OV-SAM模型通过SAM2CLIP和CLIP2SAM两个知识迁移模块来实现模型结合。 模型框架:描述了训练和推理阶段的模型框架,包括教师-学生网络的蒸馏过程,特征表示的对齐,以及推理阶段的模型使用。 Gro

2024-08-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除