哈密瓜Q-CSDN博客

原创计算机视觉-图像检索（基于BOF）

Bag-of-Features（BOF）是一种基于视觉词汇的图像表示方法，其核心流程包括特征提取、视觉词典学习、特征量化和图像投影。首先通过SIFT算法提取图像局部特征，然后使用K-means聚类生成视觉词典，将特征映射到最近的视觉单词并统计频率形成直方图向量。实验部分实现了基于华为产品图像数据集（120张4类）的BOF模型构建，包含视觉词典创建（200个聚类中心）、图像索引建立和相似图像检索功能。代码展示了从特征提取到检索匹配的全过程，通过欧氏距离和RANSAC算法优化匹配结果，最终输出前5个最相似图像。

2025-07-31 10:45:00 1146

原创计算机视觉-相机参数标定

本文介绍了相机参数标定的背景、基本原理及代码实现。相机标定是通过实验求解摄像机几何模型参数的过程，包括内参、外参和畸变系数。文章详细讲解了光学标定和自标定两种策略，以及世界坐标系、相机坐标系和图像坐标系的关系。通过Python代码实现了基于棋盘格的相机标定流程，包括角点检测、参数求解和去畸变处理。实验结果显示，内参矩阵、畸变系数、旋转平移向量等参数均成功获取，反投影误差为0.18，表明标定结果较为准确。该方法为后续视觉测量和机器视觉应用提供了可靠的相机参数基础。

2025-07-30 14:30:00 1543

原创计算机视觉-全景图像拼接

本文介绍了图像拼接的基础原理与实现方法。主要内容包括：1）图像拼接原理，涉及频率域和空间域两种方法，重点阐述了基于特征的匹配算法和RANSAC去除异常点的过程；2）2D图像变换与单应性矩阵的应用；3）通过Python代码实现两组不同场景的图片拼接实验，结果表明拍摄角度变化较小时拼接效果更佳，但仍存在光线和景深导致的误差。文章还提供了运行过程中"ModuleNotFoundError"问题的解决方案。整体展示了从理论到实践的图像拼接技术实现过程。

2025-07-30 11:30:00 1856

原创计算机视觉-局部图像描述子

本文介绍了Harris角点检测的理论基础及实现方法。首先阐述了角点的定义、类型及性质，重点分析了Harris角点检测的基本思想与数学模型，通过窗口灰度变化构建协方差矩阵，利用特征值和角点响应函数判断角点。实验部分展示了不同阈值下的Harris角点检测效果，以及角点匹配应用。最后指出Harris算法的局限性，并引入SIFT算法解决尺度不变性问题。文章通过理论推导与代码实现相结合的方式，系统讲解了角点检测技术在计算机视觉中的应用。

2025-07-29 17:18:58 1265

原创计算机视觉-图像基础处理

本文介绍了OpenCV的安装方法及常见问题处理，包括使用pip安装OpenCV、Pycharm中模块路径配置错误的解决方案。详细讲解了图像直方图原理及实现代码，展示了对灰度图和彩色图进行高斯滤波的效果对比，并探讨了不同标准差参数对滤波结果的影响。最后介绍了直方图均衡化的原理及Python代码实现，通过实际案例展示了均衡化前后图像及直方图的变化效果。文章包含完整代码示例和运行结果图示，适合图像处理初学者参考学习。

2025-07-29 17:03:14 976

原创 Kaggle竞赛——商店销售时序预测（Store Sales）

竞赛的任务是基于以往的时序数据来预测未来15天销售额，需要从给定的数据集中分析并提取有价值的特征。可视化分析发现每日油价与每日平均销售额的相关系数为 **-0.6269**，呈**负相关**，因此可将每日油价数据合并到训练集中。通过趋势分析发现平均销售额整体呈线性上升趋势，根据趋势特征选择**线性回归**模型来拟合趋势。节假日分析表明节假日和非节假日的销售额之间分层明显，**节假日的销售额整体大于非节假日的销售额**，因此将判断是否为节假日的特征列并入训练集以区分节假日和非节假日。

2025-04-15 16:57:31 2759 3

原创 Kaggle竞赛——灾难推文分类（Disaster Tweets）

竞赛的数据集中，训练集有7613个样本，测试集有3263个样本。训练集中的`target`用于标识推文是否属于灾难推文（1表示灾难推文，0表示非灾难推文），最终任务是判断测试集中的推文样本是否为灾难推文，评估指标是F1值。竞赛使用的模型是DistilBert，DIstilBERT是 transformers 库中的模型。提交代码后最终评分（F1值）为0.82071。

2024-10-25 12:00:35 1536 1

原创 ExtraTree|GBDT|XGBoost模型原理

ExtraTree、GBDT 和 XGBoost 都是基于决策树的算法。ExtraTree属于Bagging（装袋法）方法，GBDT和XGBoost则属于Boosting（提升树）方法，通过逐步优化残差（GBDT使用一阶导数，XGBoost结合了一阶和二阶导数）来生成树。

2024-10-13 21:55:37 2084

原创 Kaggle竞赛——森林覆盖类型分类

本次竞赛的数据集包含训练集和测试集，数据集的研究区域包含位于科罗拉多州北部罗斯福国家森林的四个荒野区域，这些区域受人为干扰影响最小，每个观测样本的区域大小为 30m x 30m。其中，训练集大小有15120个样本，测试集有565892个样本。共56个特征，7种类别（用数字1-7表示），第一列为样本`Id`列，最后一列`Cover_Type`为标签列。最终评分为0.78729。

2024-10-12 19:54:08 1612

原创 Kaggle竞赛——手写数字识别（Digit Recognizer）

竞赛使用的是 MNIST (Modified National Institute of Standards and Technology，美国国家标准与技术研究院修改版) 手写图像数据集，其中训练集42000条，测试集28000条，每条数据有784 个像素点，即原始图像的像素为 28 * 28。训练集中的Label列表示手写数字的类别（共10个类别，0-10）。

2024-09-02 17:03:11 2328 6

原创 Kaggle竞赛——心脏病患者预测与可视化

Kaggle中已经没有对应的比赛，所以只能从数据集中划分出测试集以验证模型的准确率。模型仅使用随机森林，本文侧重点在于数据分析的可视化和模型可解释性分析。所使用的python虚拟环境、数据集和代码已打包上传到Gitee，。

2024-08-17 17:03:16 3055 4

原创服务器利用宝塔面板部署Django项目

记录服务器部署Django项目的三种方法，由于项目没有用到数据库服务，所以部署过程不涉及数据库相关的连接和配置（后续使用到数据库再补充）

2024-07-22 18:15:30 3287

原创 Kaggle竞赛——房价预测

Kaggle房价预测，含特征分析与数据处理，通过超参数优化函数寻找最佳参数，最终使用XGBoost模型预测结果。本次官网提交的得分是0.13227，排名1209（提交日期：2024年6月30日）。

2024-07-01 16:05:12 7401 7

原创机器学习算法——主成分分析（PCA）

具体来说，第一主成分是数据中方差最大的特征（即该特征下的值的方差最大），数据点在该方向有最大的扩散性（即在该方向上包含的信息量最多）。第二主成分与第一主成分正交（即与第一主成分无关），并在所有可能正交方向中，选择方差次大的方向。然后，第三主成分与前两个主成分正交，且选择在其余所有可能正交方向中有最大方差的方向，以此类推，中，紫色线方向上数据的方差最大（该方向上点的分布最分散，包含了更多的信息量），则可以将该方向上的特征作为第一主成分。表示已经中心化后的值），协方差矩阵的计算（二维）

2023-11-24 23:48:09 2491

原创机器学习算法——聚类算法

聚类算法是一种无监督学习方法，用于将数据集中的对象分组或聚集成具有相似特征的集合，该集合被称为簇(cluster)。聚类算法通过计算数据点之间的相似性或距离，将相似的数据点归为同一簇，使簇内差距最小化，簇间差距最大化，从而将数据集划分为多个互相区分的组。聚类算法的目标是在无标签的情况下，发现数据中的内在结构和模式。聚类算法可以发现数据中的隐藏模式、异常值或离群点，以及进行数据预处理和可视化。

2023-11-23 16:02:18 1743

原创机器学习算法——集成学习

Bagging（bootstrap aggregating：自举汇聚法）也叫装袋法，其思想是通过将许多相互独立的学习器的结果进行结合，从而提高整体学习器的泛化能力，是一种并行集成学习方法。且Bagging的准确率可能会比单分类器的准确率低。

2023-11-18 17:04:02 936 1

原创机器学习算法——线性回归与非线性回归

例如两个变量之间成正比（例如：x1 为房子的面积，单位是平方英尺；x2为房子的面积，单位是平方米；不可逆的情况很少发生，如果有这种情况，其解决问题的方法之一便是使用正则化以及岭回归等来求最小二乘法。的适用范围更广，可以用于描述非线性或者有两个及两个以上自变量的相关关系，它可以用来评价模型的效果。常用相关系数来衡量两个变量间的相关性，相关系数越大，相关性越高，使用直线拟合样本点时效果就越好。下图的样本点中，左图的相关系数为0.993，右图的相关系数为0.957，即。由推导的公式可知，需要满足的条件是。

2023-11-11 11:16:29 1728

原创 WIN11系统设置重启与睡眠唤醒后自动拨号

两个触发器分别代表重启和睡眠唤醒事件。在任务计划程序中创建基本任务。

2023-10-14 10:50:05 1517

原创使用 ip2region 获取用户的 IP 归属地

ip2region 是一个离线IP地址定位库和IP定位数据管理框架，10微秒级别的查询效率，提供了众多主流编程语言的 xdb 数据生成和查询客户端实现。国家|区域|省份|城市|ISP，只有中国的数据绝大部分精确到了城市，其他国家部分数据只能定位到国家，后前的选项全部是0。

2023-04-19 22:25:42 7106

原创 Editor.md 的使用方法及图片处理

出于项目需要，在去除多余文件后 Editor.md 的一些渲染样式也被我修改，将资源（精简后 Editor.md 资源。JS 中的属性和值可参考资源下的。

2023-03-04 17:04:50 1359

原创将IDEA的项目托管到gitee

可能是因为在手动修改了远程仓库中的文件，导致一些文件在本地仓库和远程仓库上不一致从而发生冲突。代码含义：允许合并两个没有共同祖先的分支。在项目文件所在地方右键，选择。代码含义：强制提交与合并。

2023-03-01 20:07:19 1213

原创粘性定位解析

粘性定位可认为是相对定位和固定定位的结合，元素在跨越特定阈值前表现为相对定位，之后表现为固定定位。粘性定位的元素依赖于用户的滚动，在 relative 与 fixed 定位之间切换。四个阈值其中之一，才可使粘性定位生效，否则其行为与相对定位相同。该样例使黄色的块元素在距离顶部。该样例使黄色的块元素在距离顶部。

2023-02-27 22:02:07 670

原创 Spring Boot系列04--静态资源处理

Spring Boot 的版本是 2.7.8，tomcat 的版本是 9.0.71。Spring Boot 通过内嵌的 tomcat 来运行项目，但需要依靠本地的 java 环境，我本地的 java 版本是 Java 1.8.0_261（即 java 8 版本），一般 java 8 和 tomcat 8.x.x 配套使用，这里可能是版本冲突导致的问题。将项目的 SDK 改为。注：一旦自定义了静态文件夹的路径，则默认的静态资源路径就会失效。时，会默认映射到静态资源文件夹下的 index.html。

2023-02-26 23:08:37 761

原创 Spring Boot系列03--自动配置原理

容器启动的时候会加载很多自动配置类，但是这些自动配置类需在特定条件满足的情况下才会起作用，即必须是@Conditional指定的条件成立时，才将组件添加到容器，配置里面的所有内容才生效。Spring Boot 启动时会加载大量的自动配置类（下图文件中的Auto Configure部分，但是我的文件没发现），每一个 xxxAutoConfiguration 类都是容器中的一个组件，并且都会加入到容器中，这些自动配置类在某些条件之才会生效。该注解使用时必须将对象注入到 IOC 容器中才有配置绑定的功能。

2023-02-25 10:23:44 642

原创 Spring Boot系列02--yaml语法

yaml语法与相关应用

2023-02-23 16:10:54 197

原创 Spring Boot系列01--创建第一个Spring Boot项目

Spring Web插件能为项目集成Tomcat、配置dispatcherServlet和xml文件。至此，SpringBoot项目搭建成功。在target目录下打开命令行终端，输入。在IDEA中新建项目，选择。将版本改为2.7.8即可。项目启动后在地址栏输入。

2023-02-21 16:21:26 418

原创服务器部署流程与经验记录

服务器部署流程与经验记录

2023-02-20 10:40:49 2345

原创 Java算法解题小记

Java算法解题速记1. 返回两个整数中的最小值2. 返回三个整数中的最小值3. 将小数以百分号的形式输出4. 检查字符串是否为纯数字1. 返回两个整数中的最小值int min2(int a, int b){ return a < b ? a : b; }2. 返回三个整数中的最小值int min3(int a, int b, int c){ int min2; return c < (min2=a < b ? a : b) ? a :

2022-09-25 15:31:24 478

原创 Java多线程详解

本文介绍了线程与进程的基本概念，以及Java中多线程的实现方式。进程是资源分配的基本单位，线程是CPU调度的基本单位。Java程序至少包含主线程和垃圾回收线程。文章详细讲解了三种创建线程的方法：继承Thread类、实现Runnable接口和使用匿名内部类，并通过代码示例演示了线程的并发执行。此外，还介绍了线程的生命周期状态转换、线程休眠（sleep方法）及通过interrupt方法唤醒休眠线程的机制。最后指出单核CPU实现线程并发执行，而多核CPU才能实现真正的并行处理。

2022-01-28 12:45:24 605

原创 Java环境变量的配置与详解

本文介绍了Java开发中三个关键环境变量的配置方法： Path变量：配置JDK的bin目录（如D:\Java\jdk1.8\bin），使系统能在任意目录识别javac等命令； classpath变量：自定义字节码文件搜索路径（如D:\javacode\class），指导JVM类加载器定位.class文件； JAVA_HOME变量：指定JDK根目录（如D:\Java\jdk1.8），供Tomcat等第三方软件调用，并支持Path变量用%JAVA_HOME%\bin动态引用。配置时需区分用户变量（单用户生效）

2022-01-28 12:44:34 622

空空如也

从服务器中的MYSQL取出的时间会多带一个0

本地能正常运行的项目部署到服务器上后无法访问数据库

SSM项目部署到服务器访问无响应

jsp使用KaTeX渲染数学公式出错

找一个适合用于ID3（信息增益）算法的简单数据集（100个样本以上）

SSM框架中Model传到jsp的数据（单个对象）不能单独取出，只能通过foreach循环

后台从数据库获取内容的第一张照片作为缩略图

阿里云服务器部署项目连接数据库的问题

java中的hasnext()问题

SSM架构中静态资源的访问地址问题

关于SSM框架整合时业务层的实现类添加@Service后仍不能创建对应bean的问题