lda进行图片分类_基于LDA和SVM的图像场景分类

125 Internet Application 互联网 + 应用 一、引言 近年来,随着数字图像处理的高速发展,人们获取图像数据越来越多,而这些图像中蕴含着海量的信息,人工根本无法对如此巨大的数据进行实时处理。因此,让计算机自动识别图像成为了一个迫切的需求,引发了大量学者对其进行广泛深入的研究,图像识别对信息的自动获取具有重要意义 [1]。 场景识别是图像分类识别的一种,场景识别的目的是对图像自动分配多个语义标签 [2],根据给定的一组语义类标,对图像进行自动标注 [3],如山川,海滩,河流,卧室,街道等。 SVM 支持向量机在图像分类上取得了广泛的应用,就起思路而言,都是首先提取出图像的底层特征,诸如SIFT特征,HOG特征等等图片的底层特征,在设法将其转化为对图片的语义表达,再对提取出语义特征的基础上,对于分类器的设计,则广泛采用 SVM 进行设计,例如 Navneet Dalal 和 Bill Triggs[4] 提出的 HOG 特征应用于行人检测上,并取得了良好 的效果。 主题模型潜在狄利克雷分布 (Latent Dirichlet Allocation, LDA),被普遍用于文档自动分类识别中。LDA模型的关键思想就是假定每一个文件中的词都是由话题混合而成,并被认为是一个服从多项式的概率分布。自Blei[5] 提出LDA以来,便在文本处理领域发挥出巨大的作用,相比早期的LDA利用 EM 来估计参数,现在 Gibbs 采样算法估计参数也得到了比较好的效果。学者 Wei 和 Croft[6] 等人,成功应用 LDA 进行信息检索并且在潜在的语义分析方面,精度上显著地超越了现有的一些算法。LDA 也应用与大数据的文本数据库 本文的主要研究的内容是利用 LDA 模型和 SVM 进行图像场景分类 , 并与传统的词袋模型进行对比。本文在第二部分介绍了 SVM 和 LDA 的基本原理,第三部分介绍场景分类的基本思路,第四部分进行仿真并得出结论。 二、理论背景 2.1 线性 SVM 对于n 维情形,假设有N 个样本(x1,y1),(x2,y2),...,(xN,yN),xi ∈ Rn,yi ∈ {+1,-1} 其中每个样本是 d 维向量,y 是类别标号,ω1 类用 +1 表示,ω2 类用 -1 表示。这些样本是线性可分的,如图 1,其中圆圈和菱形分别表示两类,H1,H2 是平行于分类面的超平面,在 H1,H2 上的训练样本就叫做支持向量,图中实心点所示, 基于 LDA 和 SVM 的图像场景分类 □曾康林 刘汉文 武汉理工大学 理学院 【摘要】 针对传统的SVM做图像场景识别的词袋模型识别率低的缺点,本文引入了自然语言领域的潜在狄利克雷分配(latent Dirichilet allocation,LDA)来进行图像场景分类。相比于在普通的词袋模型,再得到了视觉词典,后直接利用SVM支持向量机进行分类。 LDA 模型则是利用 LDA 得到图片的主题表示再进行 SVM 的分类。仿真实验结果表明,相比于普通的词袋模型,利用 LDA 得到的主题表示可有效提高场景分类的正确率。 【关键字】 潜在狄利克雷分配 (LDA) 支持向量机 (SVM) 图像场景分类 其中超平面方程为 g(x)=(w·x)+b=0。 图 1 分类间隔与超平面 而目标是使得分支持向量到最优超平面的距离最大,其间距为 1/‖w‖。从而优化模型可以表示为 (1) 利用 Lagrange 乘子法解出 w 值,进而得到分类面方程,对样本进行分类。 2.2 LDA 模型 LDA是一个无监督的基于概

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值