lda进行图片分类_基于LDA和SVM的图像场景分类

最新推荐文章于 2022-12-19 14:06:39 发布

weixin_39700397

最新推荐文章于 2022-12-19 14:06:39 发布

阅读量716

点赞数

文章标签： lda进行图片分类

本文链接：https://blog.csdn.net/weixin_39700397/article/details/112923415

版权

125 Internet Application 互联网 + 应用一、引言近年来，随着数字图像处理的高速发展，人们获取图像数据越来越多，而这些图像中蕴含着海量的信息，人工根本无法对如此巨大的数据进行实时处理。因此，让计算机自动识别图像成为了一个迫切的需求，引发了大量学者对其进行广泛深入的研究，图像识别对信息的自动获取具有重要意义 [1]。场景识别是图像分类识别的一种，场景识别的目的是对图像自动分配多个语义标签 [2]，根据给定的一组语义类标，对图像进行自动标注 [3]，如山川，海滩，河流，卧室，街道等。 SVM 支持向量机在图像分类上取得了广泛的应用，就起思路而言，都是首先提取出图像的底层特征，诸如SIFT特征，HOG特征等等图片的底层特征，在设法将其转化为对图片的语义表达，再对提取出语义特征的基础上，对于分类器的设计，则广泛采用 SVM 进行设计，例如 Navneet Dalal 和 Bill Triggs[4] 提出的 HOG 特征应用于行人检测上，并取得了良好的效果。主题模型潜在狄利克雷分布 (Latent Dirichlet Allocation, LDA)，被普遍用于文档自动分类识别中。LDA模型的关键思想就是假定每一个文件中的词都是由话题混合而成，并被认为是一个服从多项式的概率分布。自Blei[5] 提出LDA以来，便在文本处理领域发挥出巨大的作用，相比早期的LDA利用 EM 来估计参数，现在 Gibbs 采样算法估计参数也得到了比较好的效果。学者 Wei 和 Croft[6] 等人，成功应用 LDA 进行信息检索并且在潜在的语义分析方面，精度上显著地超越了现有的一些算法。LDA 也应用与大数据的文本数据库本文的主要研究的内容是利用 LDA 模型和 SVM 进行图像场景分类 , 并与传统的词袋模型进行对比。本文在第二部分介绍了 SVM 和 LDA 的基本原理，第三部分介绍场景分类的基本思路，第四部分进行仿真并得出结论。二、理论背景 2.1 线性 SVM 对于n 维情形，假设有N 个样本(x1,y1),(x2,y2),...,(xN,yN)，xi ∈ Rn，yi ∈ {+1,-1} 其中每个样本是 d 维向量，y 是类别标号，ω1 类用 +1 表示，ω2 类用 -1 表示。这些样本是线性可分的，如图 1，其中圆圈和菱形分别表示两类，H1,H2 是平行于分类面的超平面，在 H1,H2 上的训练样本就叫做支持向量，图中实心点所示，基于 LDA 和 SVM 的图像场景分类 □曾康林刘汉文武汉理工大学理学院【摘要】针对传统的SVM做图像场景识别的词袋模型识别率低的缺点，本文引入了自然语言领域的潜在狄利克雷分配(latent Dirichilet allocation，LDA)来进行图像场景分类。相比于在普通的词袋模型，再得到了视觉词典，后直接利用SVM支持向量机进行分类。 LDA 模型则是利用 LDA 得到图片的主题表示再进行 SVM 的分类。仿真实验结果表明，相比于普通的词袋模型，利用 LDA 得到的主题表示可有效提高场景分类的正确率。【关键字】潜在狄利克雷分配 (LDA) 支持向量机 (SVM) 图像场景分类其中超平面方程为 g(x)=(w·x)+b=0。图 1 分类间隔与超平面而目标是使得分支持向量到最优超平面的距离最大，其间距为 1/‖w‖。从而优化模型可以表示为 (1) 利用 Lagrange 乘子法解出 w 值，进而得到分类面方程，对样本进行分类。 2.2 LDA 模型 LDA是一个无监督的基于概