图像特征提取中的一些不变形,平移不变性,旋转不变性 光照不变性

不变性:就是目标发生了变换,但是你依然可以识别出来。
在图像任务中,我们希望图像中的目标即使被平移、被旋转或者被缩放,模型都可以识别出来。
主要有以下几种不变性:

  1. 平移不变性
  2. 旋转不变性
  3. 尺度不变性
  4. 光照不变性

目标检测的不变性:卷积神经网络是将“空间不变性”的这一概念 系统化,用较少的参数来学习有用的特征。从而使物体不管在什么位置,可以利用物体的不变性,来找到物体
**平移不变性:**不管出现在图像中的哪个位置,神经网络的底层应该对相同的图像区域做出类似的响应。 这个原理即为“平移不变性”。
卷积,可以通过相同的卷积核提取特征,使得当物体在不同的位置时,但都能提取到物体的关键特征。只是位置发生了变化。
但是当输入图像中,改变一个像素就可能会得到不同的结构,所以没有平移不变性。
池化,下采样,当图像中平移了2个单位,但是当感受野恰好步长也是2 ,则可以得到平移不变性。池化还可以得到旋转不变性和尺度不变性。
Max pooling的局部平移不变性:
这是由于Max Pooling取得是一个区域内的极大值。 当s=2时,即可保持不变性。
在这里插入图片描述
但是有的就认为池化并没有不变性。我也感觉池化不容易保证平移不变性。如经过多次池化就不容易保持平移不变性。
旋转不变性
旋转不变性:只要对特征定义了方向,然后在同一个方向上进行特征描述就可以实现旋转不变性。

在图像锐化的时候,看到有一句话“拉普拉斯算子是最简单的各向同性微分算子,具有旋转不变性”,才体会到,旋转不变性,在图像处理中是有应用的。好像作用还挺大。在目标边缘检测的时候,目标所在图像在随机的变化,那么检测它的算子就应该具有适应性,尤其在不同的方向。拉普拉斯算子刚好满足这个需求,因为其具有旋转不变性。

各向异性:是一个像素点在四个方向上的值都一样。
当然也有各向异性,各向异性值的是一个像素点在四个方向上的梯度变化不一样。
拉普拉斯算子在图像处理中的应用

拉普拉斯算子在图像处理中的应用2
傅立叶变换也可以提取图像的旋转不变性。将提取的特征值进行傅里叶变换来使特征具有平移、伸缩、旋转不变性

在这里插入图片描述
极坐标傅立叶变换的旋转不变性
尺度不变性:为了实现尺度不变性,需要给特征加上尺度因子。在进行特征描述的时候,将尺度统一就可以实现尺度不变性了。

所谓的旋转不变性和尺度不变性的原理,就是我们在描述一个特征之前,将两张图像都变换到同一个方向和同一个尺度上,然后再在这个统一标准上来描述这个特征。同样的,如果在描述一个特征之前,将图像变换到同一个仿射尺度或者投影尺度上,那么就可以实现仿射不变性和投影不变性

光照不变性
LBP的灰度/光照不变性,是通过邻域内像素点减去中心像素的值再经过阈值处理(0,1)的来实现对光照不敏感的。
在这里插入图片描述
深度学习中光照不变性及旋转不变性

局部性:神经网络的底层应该只探索输入图像中的局部区域,而不考虑图像远处区域的内容,这就是 “局部性”原则。最终,这些局部特征可以融会贯通,在整个图像级别上做出预测。
局部性是在每一层只能包含局部信息。

内容概要:本文介绍了国产通用人工智能(AGI)公司DeepSeek推出的开源推理模型DeepSeek-R1及其广泛应用场景和技术背景。DeepSeek-R1免费商用且擅处理复杂数理推理及逻辑分析任务,提供包括智能对话、文本生成、语义理解、代码生成在内的多元化应用服务。文章讲解了使用场景如代码生成及优化、长文摘要创作、逻辑分析及验证,同时分析了与非推理模型的区别。并且探讨了如何利用提示工程技术最大限度挖掘模型效能,并结合具体案例演示了模型如何在各类应用场景中发挥作用。此外,文章强调了模型选择与提示设计策略,避免在实际操作中走入设计陷阱和误区的方法,确保用户能充分利用DeepSeek的各项功能实现更出色的AI应用开发。 适合人群:有一定编程或机器学习基础并对AGI感兴趣的研发人员或学者。 使用场景及目标:①帮助开发者高效完成逻辑推理强的任务如编程、代码调试、智能咨询、文本分析和语义处理;②为科研人员提供更多关于大模型内部结构与运作原理的学习材料;③助力创业者与产品经理更好地将先进AI技术集成到具体的产品或服务中以提升市场竞争力。 其他说明:除了理论指导,本文亦包含了大量实战技巧和建议,覆盖模型选择、性能对比以及不同模型下提示语的设计原则,力求为用户提供最全面和细致的帮助和支持。
### DeepSeek开源概述 #### 参与方式 对于希望参与到DeepSeek开源的个人或团队而言,官方通常会开放注册通道,在线报名成为参与的前提条件之一。参与者可以通过访问官方网站获取详细的指南文档和API接口说明文件来准备自己的贡献方案[^1]。 #### 活动内容 活动期间内安排了一系列丰富多彩的内容形式,包括但不限于在线研讨会(Webinar),直播讲座(Live Talk Show),以及黑客松(Hackathon)竞赛单元。特别是针对“最期待开源项目”的社区调研结果显示,超过半数以上的开发者表达了对“搜索引擎系统”的高度关注,因此围绕这一主题展开的技术交流和技术挑战赛成为了本次活动的一大亮点。 #### 时间规划 虽然具体的日期未被提及,但是可以推测该系列活动一般会选择在一个特定的时间段集中举行,比如连续七天左右,以便于吸引更多的注意力并形成良好的互动氛围。“72小时复现计划”这样的短期高强度任务也表明了部分环节可能设置了紧凑的日程表以激发创新潜力。 ```python # 示例:假设这是用于查询开源期间事件的一个简单Python脚本 import requests def get_event_schedule(): url = "https://api.deepseek.com/events" response = requests.get(url) if response.status_code == 200: events = response.json() for event in events: print(f"{event['title']} at {event['time']}") else: print("Failed to fetch the schedule") get_event_schedule() ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值