【智能控制】第1,2章 智能控制绪论 ,模糊控制的应用理论基础,模糊集合的基本运算(北京航天航空大学)

目录

1.绪论

1. 智能控制的提出

2. 智能控制的概念

3. 智能控制的发展

4. 智能控制的几个重要分支:模糊控制

4. 智能控制的几个重要分支: 神经网络控制

5. 智能控制的特点

6. 智能控制的研究工具

(1)符号推理与数值计算的结合

(2)模糊集理论

(3)神经元网络理论  

(4)遗传算法

(5)离散事件与连续时间系统的结合

7. 智能控制的应用

     (1)在运动控制中的应用    

    (2)在过程控制中的应用    

2.1 概述——模糊控制的提出  

   

2.2   模糊集合

    2.2.1 模糊集合        

1 特征函数和隶属函数

2  模糊集合的表示

例2.1 

例2.2

2.2.2 模糊集合的运算

1  模糊集合的基本运算      

(1)空集

(2)全集    

(3)等集      

(4)补集    

(5)子集

(6)并集

(7)交集

(8)模糊运算的基本性质     

表2-1 运 算 法 则

例2.3    

例2.4

2  模糊算子        

(1)交运算算子

①  模糊交算子

  ②  代数积算子

③ 有界积算子


1.绪论

1. 智能控制的提出

        传统控制方法包括经典控制和现代控制,基于被控对象精确模型的控制方式,缺乏灵活性和应变能力,适于解决线性、时不变性等相对简单的控制问题。传统控制方法在实际应用中遇到很多难解决的问题,主要表现以下几点:

(1)实际系统由于存在复杂性、非线性、时变性、不确定性和不完全性等,无法获得精确的数学模型。

(2)某些复杂的和包含不确定性的控制过程无法用传统的数学模型来描述,即无法解决建模问题。

(3)针对实际系统往往需要进行一些比较苛刻的线性化假设,而这些假设往往与实际系统不符合。

(4)实际控制任务复杂,而传统的控制任务要求低,对复杂的控制任务,如智能机器人控制、社会经济管理系统等无能为力。

       在生产实践中,复杂控制问题可通过熟练操作人员的经验和控制理论相结合去解决,由此,产生了智能控制。智能控制采取了人的思维方式,建立逻辑模型,使用类似人脑的控制方法来进行控制。    

      智能控制将控制理论的方法和人工智能技术灵活地结合起来,其控制方法适应对象的复杂性和不确定性。

      智能控制是控制理论发展的高级阶段,它主要用来解决那些用传统控制方法难以解决的复杂系统的控制问题。智能控制研究对象具备以下一些特点:

(1)不确定性的模型:智能控制适合于不确定性对象的控制,其不确定性包括两层意思:一是模型未知或知之甚少;二是模型的结构和参数可能在很大范围内变化。

(2)高度的非线性:采用智能控制方法可以较好地解决非线性系统的控制问题。

(3)复杂的任务要求:例如,智能机器人要求控制系统对一个复杂的任务具有自行规划和决策的能力,有自动躲避障碍运动到期望目标位置的能力。再如,在复杂的工业过程控制系统中,除了要求对各被控物理量实现定值调节外,还要求能实现整个系统的自动启停、故障的自动诊断以及紧急情况下的自动处理等功能。

2. 智能控制的概念

    智能控制是一门交叉学科,著名美籍华人傅京逊教授1971年首先提出智能控制是人工智能与自动控制的交叉,即二元论。美国学者G.N.Saridis1977年在此基础上引入运筹学,提出了三元论的智能控制概念,即

      IC=AC ∩ AI ∩ OR

式中各子集的含义为:

IC—智能控制(Intelligent Control)

AI—人工智能(Artificial Intelligence)

AC—自动控制(Automatic Control)

OR—运筹学(Operational Research)

基于三元论的智能控制如下图所示。

人工智能(AI)是一个用来模拟人思维的知识处理系统,具有记忆、学习、信息处理、形式语言、启发推理等功能。

自动控制(AC)描述系统的动力学特性,是一种动态反馈。

运筹学(OR)是一种定量优化方法,如线性规划、网络规划、调度、管理、优化决策和多目标优化方法等。    

三元论除了“智能”与“控制”外还强调了更高层次控制中调度、规划和管理的作用,为递阶智能控制提供了理论依据。

      所谓智能控制,即设计一个控制器,使之具有学习、抽象、推理、决策等功能,并能根据环境(包括被控对象或被控过程)信息的变化做出适应性反应,从而实现由人来完成的任务。智能控制实际只是研究与模拟人类智能活动及其控制与信息传递过程的规律,研制具有仿人智能的工程控制与信息处理系统的一个新兴分支学科。

3. 智能控制的发展

    智能控制是自动控制发展的最新阶段,主要用于解决传统控制难以解决的复杂系统的控制问题。控制科学的发展过程如图所示

     二十世纪60年代起,由于空间技术、计算机技术及人工智能技术的发展,控制界学者在研究自组织、自学习控制的基础上,为了提高控制系统的自学习能力,开始注意将人工智能技术与方法应用于控制中。  

      1966年,J.M.Mendal首先提出将人工智能技术应用于飞船控制系统的设计;1971年,傅京逊首次提出智能控制这一概念,并归纳了三种类型的智能控制系统:

(1)人作为控制器的控制系统:人作为控制器的控制系统具有自学习、自适应和自组织的功能;

(2)人—机结合作为控制器的控制系统:机器完成需要连续进行的并需快速计算的常规控制任务,人则完成任务分配、决策、监控等任务;

(3)无人参与的自主控制系统:为多层的智能控制系统,需要完成问题求解和规划、环境建模、传感器信息分析和低层的反馈控制任务。如自主机器人。

     1985年8月,IEEE在美国纽约召开了第一界智能控制学术讨论会,随后成立了IEEE智能控制专业委员会;1987年1月,在美国举行第一次国际智能控制大会,标志智能控制领域的形成。    

    近年来,神经网络、模糊数学、专家系统、进化论等各门学科的发展给智能控制注入了巨大的活力,由此产生了各种智能控制方法。

4. 智能控制的几个重要分支:模糊控制

     以往的各种传统控制方法均是建立在被控对象精确数学模型基础上的,然而,随着系统复杂程度的提高,将难以建立系统的精确数学模型。    

        在工程实践中,人们发现,一个复杂的控制系统可由一个操作人员凭着丰富的实践经验得到满意的控制效果。这说明,如果通过模拟人脑的思维方法设计控制器,可实现复杂系统的控制,由此产生了模糊控制。

      1965年美国加州大学自动控制系L.A.Zedeh提出模糊集合理论,奠定了模糊控制的基础;1974年伦敦大学的Mamdani博士利用模糊逻辑,开发了世界上第一台模糊控制的蒸汽机,从而开创了模糊控制的历史;1983年日本富士电机开创了模糊控制在日本的第一项应用—水净化处理,之后,富士电机致力于模糊逻辑元件的开发与研究,并于1987年在仙台地铁线上采用了模糊控制技术,1989年将模糊控制消费品推向高潮,使日本成为模糊控制技术的主导国家。

         基于模糊控制的发展可分为三个阶段:

(1)1965年-1974年为模糊控制发展的第一阶段,即模糊数学发展和形成阶段;

(2)1974年-1979年为模糊控制发展的第二阶段,产生了简单的模糊控制器;

(3)1979年—现在为模糊控制发展的第三阶段,即高性能模糊控制阶段。    

          模糊逻辑控制器的设计不依靠被控对象的模型,但它却非常依靠控制专家或操作者的经验知识。模糊逻辑控制的突出优点是能够比较容易地将人的控制经验溶入到控制器中,但若缺乏这样的控制经验,很难设计出高水平的模糊控制器。    

     采用模糊系统可充分逼近任意复杂的非线性系统,基于模糊系统逼近的自适应模糊控制是模糊控制的更高形式。

4. 智能控制的几个重要分支: 神经网络控制

      神经网络的研究已经有几十年的历史了。1943年McCulloch和Pitts提出了神经元数学模型;1950年-1980年为神经网络的形成期,有少量成果,如1975年Albus提出了人脑记忆模型CMAC网络,1976年Grossberg提出了用于无导师指导下模式分类的自组织网络;1980年以后为神经网络的发展期,1982年Hopfield提出了Hopfield网络,解决了回归网络的学习问题。1986年美国Rumelhart等提出了BP网络,该网络是一种按照误差逆向传播算法训练的多层前馈神经网络,为神经网络的应用开辟了广阔的发展前景。

      将神经网络引入控制领域就形成了神经网络控制。神经网络控制是从机理上对人脑生理系统进行简单结构模拟的一种新兴智能控制方法。神经网络具有并行机制、模式识别、记忆和自学习能力的特点,它能够学习与适应不确定系统的动态特性,有很强的鲁棒性和容错性等。采用神经网络可充分逼近任意复杂的非线性系统,基于神经网络逼近的自适应神经网络控制是神经网络控制的更高形式。神经网络控制在控制领域有广泛的应用。

    智能搜索算法是人工智能的一个重要分支。随着优化理论的发展,智能算法得到了迅速发展和广泛应用,成为解决搜索问题的新方法,如遗传算法、粒子群算法、差分进化算法等。这些优化算法都是通过模拟揭示自然现象和过程来实现,其优点和机制的独特,为具有搜索问题提供了切实可行的解决方案。

    20世纪70年代初,美国密西根大学的霍兰教授和他的学生提出并创立了一种新型的优化算法—遗传算法。遗传算法的基本思想来源于达尔文的进化论,该算法将待求的问题表示成串(或称染色体),即为二进制码或者整数码串,从而构成一群串,并将他们置于问题的求解环境中。根据适者生存的原则,从中选择出适应环境的串进行复制,并且通过交换、变异两种基因操作产生出新的一代更加适应环境的串群。经过一代代的不断变化,最后收敛到一个最适应环境的串上,即求得问题的最优解。

     粒子群优化算法也是一种进化计算技术,1995年由Eberhart博士和Kennedy博士提出,该算法源于对鸟群捕食的行为研究。与遗传算法相似,粒子群算法也是从随机解出发,通过迭代寻找最优解,它也是通过适应度来评价解的品质,但它比遗传算法规则更为简单,没有遗传算法的“交叉”和“变异”操作,通过追随当前搜索到的最优值来寻找全局最优。这种算法以其实现容易、精度高、收敛快等优点引起了学术界的重视,并且在解决系统辨识问题中展示了其特殊的优越性。

       差分进化算法是一种新兴的进化计算技术,它是由Storn等人于1995年提出的。该算法保留了基于种群的全局搜索策略,采用实数编码、基于差分的简单变异操作和一对一的竞争生存策略,降低了遗传操作的复杂性。同时,差分进化算法特有的记忆能力使其可以动态跟踪当前的搜索情况,以调整其搜索策略,具有较强的全局收敛能力和鲁棒性, 且不需要借助问题的特征信息,适于求解一些利用常规的数学规划方法所无法求解的复杂环境中的优化问题。

     智能算法不依赖于问题模型本身的特性,能够快速有效的搜索复杂、高度非线性和多维空间,为智能控制的研究与应用开辟一条新的途径。

5. 智能控制的特点

(1)学习功能:智能控制器能通过从外界环境所获得的信息进行学习,不断积累知识,使系统的控制性能得到改善;

(2)适应功能:智能控制器具有从输入到输出的映射关系,可实现不依赖于模型的自适应控制,当系统某一部分出现故障时,也能进行控制;

(3)自组织功能:智能控制器对复杂的分布式信息具有自组织和协调的功能,当出现多目标冲突时,它可以在任务要求的范围内自行决策,主动采取行动。

(4)优化能力:智能控制能够通过不断优化控制参数和寻找控制器的最佳结构形式,获得整体最优的控制性能。

6. 智能控制的研究工具

(1)符号推理与数值计算的结合

如专家控制,它的上层是专家系统,采用人工智能中的符号推理方法;下层是传统意义下的控制系统,采用数值计算方法。

(2)模糊集理论

模糊集理论是模糊控制的基础,其核心是采用模糊规则进行逻辑推理,其逻辑取值可在0与1之间连续变化,其处理的方法是基于数值的而不是基于符号的。

(3)神经元网络理论  

神经网络通过许多简单的关系来实现复杂的函数,其本质是一个非线性动力学系统,但它不依赖数学模型,是一种介于逻辑推理和数值计算之间的工具和方法。

(4)遗传算法

遗传算法根据适者生存、优胜劣汰等自然进化规则来进行搜索计算和问题求解。对许多传统数学难以解决或明显失效的复杂问题,特别是优化问题,GA提供了一个行之有效的途径。

(5)离散事件与连续时间系统的结合

主要用于计算机集成制造系统(CIMS)和智能机器人的智能控制。以CIMS为例,上层任务的分配和调度、零件的加工和传输等可用离散事件系统理论进行分析和设计;下层的控制,如机床及机器人的控制,则采用常规的连续时间系统方法。

7. 智能控制的应用

      作为智能控制发展的高级阶段,智能控制主要解决那些用传统控制方法难以解决的复杂系统的控制问题,其中包括智能机器人控制、计算机集成制造系统(CIMS)、工业过程控制、航空航天控制、社会经济管理系统、交通运输系统、环保及能源系统等。下面以智能控制在机器人控制和过程控制中的应用为例进行说明。

     (1)在运动控制中的应用    

       以机器人控制为例,智能机器人是目前机器人研究中的热门课题。E.H.Mamdan于20世纪80年代初首次将模糊控制应用于一台实际机器人的操作臂控制。J.S.Albus于1975年提出小脑模型关节控制器(Cerebellar Model Arculation Controller,简称CMAC),它是仿照小脑如何控制肢体运动的原理而建立的神经网络模型,采用CMAC,可实现机器人的关节控制,这是神经网络在机器人控制的一个典型应用。目前工业上用的90%以上的机器人都不具有智能。随着机器人技术的迅速发展,需要各种具有不同程度智能的机器人。    

       飞行器是非线性、多变量和不确定性的复杂对象,是智能控制发挥潜力的重要领域。利用神经网络所具有对非线性函数的逼近能力和自学习能力,可设计神经网络飞行器控制算法。例如,利用反演控制和神经网络技术相结合的非线性自适应方法,可实现飞行系统的纵向和横侧向通道的控制器设计。

    (2)在过程控制中的应用    

        过程控制是指石油、化工、电力、冶金、轻工、纺织、制药、建材等工业生产过程的自动控制,它是自动化技术的一个极其重要的方面。智能控制在过程控制上有着广泛的应用。在石油化工方面,1994年美国的Gensym公司和Neuralware公司联合将神经网络用于炼油厂的非线性工艺过程。    

       在冶金方面,日本的新日铁公司于1990年将专家控制系统应用于轧钢生产过程。    

       在化工方面,日本的三菱化学合成公司研制出用于乙烯工程模糊控制系统。    

      智能控制应用于过程控制领域,是控制理论发展的新的方向。

2.1 概述——模糊控制的提出  

   

    以往的各种传统控制方法均是建立在被控对象精确数学模型基础上的,然而,随着系统复杂程度的提高,将难以建立系统的精确数学模型。      

     在工程实践中,人们发现,一个复杂的控制系统可由一个操作人员凭着丰富的实践经验得到满意的控制效果。这说明,如果通过模拟人脑的思维方法设计控制器,可实现复杂系统的控制,由此产生了模糊控制。

       模糊控制是建立在人工经验基础之上的。对于一个熟练的操作人员,他往往凭借丰富的实践经验,采取适当的对策来巧妙地控制一个复杂过程。若能将这些熟练操作员的实践经验加以总结和描述,并用语言表达出来,就会得到一种定性的、不精确的控制规则。如果用模糊数学将其定量化就转化为模糊控制算法,形成模糊控制理论。

   模糊控制理论具有一些明显的特点:

(1)模糊控制不需要被控对象的数学模型。模糊控制是以人对被控对象的控制经验为依据而设计的控制器,故无需知道被控对象的数学模型。

(2)模糊控制是一种反映人类智慧的智能控制方法。模糊控制采用人类思维中的模糊量,如“高”、“中”、“低”、“大”、“小”等,控制量由模糊推理导出。这些模糊量和模糊推理是人类智能活动的体现。

(3)模糊控制易于被人们接受。模糊控制的核心是控制规则,模糊规则是用语言来表示的,如“今天气温高,则今天天气暖和”,易于被一般人所接受。

(4)构造容易。模糊控制规则易于软件实现。

(5)鲁棒性和适应性好。通过专家经验设计的模糊规则可以对复杂的对象进行有效的控制。

2.2   模糊集合

    2.2.1 模糊集合        

    对大多数应用系统而言,其主要且重要的信息来源有两种,即来自传感器的数据信息和来自专家的语言信息。数据信息常用0.5,2,3,3.5等数字来表示,而语言信息则用诸如“大”、“小”、“中等”、“非常小”等文字来表示。传统的工程设计方法只能用数据信息而无法使用语言信息,而人类解决问题时所使用的大量知识是经验性的,它们通常是用语言信息来描述。语言信息通常呈经验性,是模糊的。因此,如何描述模糊语言信息成为解决问题的关键。      

     模糊集合的概念是由美国加利福尼亚大学著名教授L.A.Zadeh于1965年首先提出来的。模糊集合的引入,可将人的判断、思维过程用比较简单的数学形式直接表达出来。模糊集理论为人类提供了能充分利用语言信息的有效工具。            

    模糊集合是模糊控制的数学基础。

1 特征函数和隶属函数

 在数学上经常用到集合的概念。

例如:集合A由4个离散值x1,x2,x3,x4组成。A={x1,x2,x3,x4} 例如:集合A由0到1之间的连续实数值组成。 

以上两个集合是完全不模糊的。对任意元素x,只有两种可能:属于A,不属于A。这种特性可以用特征函数              来描述:

 为了表示模糊概念,需要引入模糊集合和隶属函数的概念:

其中A称为模糊集合,由0,1及        构成。                              

表示元素x属于模糊集合A的程度,取值范围为[0,1],称              为x属于模糊集合A的隶属度。

2  模糊集合的表示

①  模糊集合A由离散元素构成,表示为:

② 模糊集合A由连续函数构成,各元素的隶属度就构成了隶属度函数(Membership Function),此时A表示为:

       在模糊集合的表达中,符号“/”、“+”和“∫”不代表数学意义上的除号、加号和积分,它

例2.1 设论域U={张三,李四,王五},评语为“学习好”。设三个人学习成绩总评分是张三得95分,李四得90分,王五得85分,三人都学习好,但又有差异。      若采用普通集合的观点,选取特征函数们是模糊集合的一种表示方式,表示“构成”或“属于”。        

      模糊集合是以隶属函数来描述的,隶属度的概念是模糊集合理论的基石。

例2.1 

 设论域U={张三,李四,王五},评语为“学习好”。设三个人学习成绩总评分是张三得95分,李四得90分,王五得85分,三人都学习好,但又有差异。      

     若采用普通集合的观点,选取特征函数

此时特征函数分别为   C (张三)=1,    C(李四)=1,     C (王五)=1。这样就反映不出三者的差异。假若采用模糊子集的概念,选取[0,1]区间上的隶属度来表示它们属于“学习好”模糊子集A的程度,就能够反映出三人的差异。 

      采用隶属函数        ,由三人的成绩可知三人“学习好”的隶属度为    (张三)=0.95,       (李四)=0.90,  (王五)=0.85。用“学习好”这一模糊子集A可表示为:  U (张三)=0.95,U(李四)=0.90,U  (王五)=0.85。用“学习好”这一模糊子集A可表示为:

  其含义为张三、李四、王五属于“学习好”的程度分别是0.95,0.90,0.85。

例2.2

以年龄为论域,取             。Zadeh给出了“年轻”的模糊集Y,其隶属函数为

通过Matlab仿真对上述隶属函数作图,隶属函数曲线如图3-1所示。

“年轻”的隶属函数曲线

2.2.2 模糊集合的运算

1  模糊集合的基本运算      

      由于模糊集是用隶书函数来表征的,因此两个子集之间的运算实际上就是逐点对隶属度作相应的运算。

(1)空集

模糊集合的空集为普通集,它的隶属度为0,即

(2)全集    

模糊集合的全集为普通集,它的隶属度为1,即

(3)等集      

       两个模糊集A和B,若对所有元素u,它们的隶属函数相等,则A和B也相等。即

(4)补集    

若     为A的补集,则

 例如,设A为“成绩好”的模糊集,某学生     属于“成绩好”的隶属度为:  

则   属于“成绩差”的隶属度为:

(5)子集

若B为A的子集,则

(6)并集

若C为A和B的并集,则

C=A∪B

一般地,

(7)交集

若C为A和B的交集,则C=A∩B,一般地,

(8)模糊运算的基本性质     

模糊集合除具有上述基本运算性质外,还具有下表所示的运算性质。

表2-1 运 算 法 则

1.幂等律 A∪A=A,A∩A=A

2.交换律 A∪B=B∪A,A∩B=B∩A

3.结合律 (A∪B)∪C=A∪(B∪C)

(A∩B)∩C=A∩(B∩C)

4.吸收律 A∪(A∩B)=A

A∩(A∪B)=A

5.分配律 A∪(B∩C)=(A∪B)∩(A∪C)

A∩(B∪C)=(A∩B) ∪(A∩C)

6.复原律

7.对偶律

8.两极律 A∪E=E,A∩E=A

A∪Ф=A,A∩Ф=Ф

例2.3    

设        

             

求A∪B,A∩B     

则  

例2.4

 试证普通集合中的互补律在模糊集合中不成立,即

证:设                      

则   

2  模糊算子        

模糊集合的逻辑运算实质上就是隶属函数的运算过程。采用隶属函数的取大(MAX)-取小(MIN)进行模糊集合的并、交逻辑运算是目前最常用的方法。但还有其它公式,这些公式统称为“模糊算子”。        

设有模糊集合A、B和C,常用的模糊算子如下:

(1)交运算算子

设C=A∩B,有三种模糊算子:

①  模糊交算子

  ②  代数积算子

③ 有界积算子

(3)平衡算子        

当隶属函数取大、取小运算时,不可避免地要丢失部分信息,采用一种平衡算子,即“算子”可起到补偿作用。

   设A和B经过平衡运算得到C,则

其中γ取值为[0,1]。     当γ=0时,        ,相当于A∩B时的算子。

当γ=1,            ,相当于A∪B时的代数和算子。        

    平衡算子目前已经应用于德国Inform公司研制的著名模糊控制软件Fuzzy-Tech中。

下期讲隶属函数


资料仅供学习使用

如有错误欢迎留言交流

金港考研周导师的其他专栏:

光电融合集成电路技术

C语言

单片机原理

模式识别原理

数字电子技术

自动控制原理传感器技术

模拟电子技术

数据结构

 概率论与数理统计

高等数学

传感器检测技术

智能控制

嵌入式系统

图像处理与机器视觉

热工与工程流体力学

数字信号处理

线性代数

工程测试技术

金港考研周导师了解更多

  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值