机器学习（遥感）| 介绍

小时候_可叼了

已于 2023-05-29 19:34:00 修改

阅读量1.2k

点赞数

分类专栏：机器学习(遥感) 文章标签：机器学习人工智能深度学习

于 2023-05-29 19:21:03 首次发布

本文链接：https://blog.csdn.net/A_aharon/article/details/130850411

版权

机器学习(遥感) 专栏收录该内容

2 篇文章 4 订阅

订阅专栏

机器学习（遥感）|入门介绍

引言
案例分析
机器学习的基本流程

引言

机器学习是一种通过使用计算机算法从数据中学习模式和规律的方法。它的应用广泛，包括图像识别、自然语言处理、数据挖掘等领域。

在遥感领域，机器学习可以应用于以下方向：图像分类和目标检测、遥感数据解译、特征选择和降维、数据融合、地物识别和变化检测等等。

机器学习按照学习任务和学习方式通常分为以下几个部分：监督学习（分类/回归）、非监督学习（降维/聚类）以及强化学习。
监督学习（Supervised Learning）：是根据带标签的训练集中进行学习，是任务驱动型。
非监督学习（Unsupervised Learning）：是从未标记数据本身出发，寻找隐含规则的过程，是驱数据驱动型。
半监督学习，介于监督学习和非监督学习之间。它是利用一部分有标签数据，和一部分无标签数据来训练一个更好的机器学习模型。由于现实带标签数据获取困难，可以将数据发挥更大的价值，是目前的研究热点之一。
强化学习： 旨在研究和开发智能体（Agent）通过与环境交互来学习最优行为策略的方法。是一个自己学习自己评价的方法。

说明：深度学习也是机器学习的一部分，我们常说的机器学习算法指的是除了神经网络之外的传统机器学习算法（深度学习将在之后单独介绍）。
在这里插入图片描述

案例分析

我们从机器学习的监督分类对机器学习做一个了解。举个简单的例子介绍下回归和分类：
1.回归
在这里插入图片描述
将（X,Y）数据投影到二维空间，基于最小二乘法拟合一个曲线，这个曲线方程即为线性回归模型，基于该模型将X输入预测Y，评估模型的精度。

2.分类在这里插入图片描述

以二维空间为例，同一个类型在二维空间中的映射都有其相似性，我们的目的就是在数据映射的特征空间中找出最佳的“决策边界”（Decision Boundary）。图中的三个不同颜色的圈就是不同的决策边界。当任务非常复杂的时候，机器学习算法在特征空间中寻找最佳的可以将不同种类数据分开的决策边界。

机器学习的基本流程

当我们面临一个问题的时候，我们需要将问题转换为机器学习问题。现在比较成熟以及可信度最高的还是监督学习，我们将以分类和回归来对机器学习进行介绍。二者区别在于
分类： 标签数据为离散的；例如Land Use/Land Cover（土地利用/土地分类）明显是一个分类问题。
回归： 标签是连续的。当需要反演地表参数，例如植被的生物量、叶面积指数、土壤水分等，是一个回归问题。

本文简单介绍机器学习在进行预测的基本流程，之后也将对流程中的每部分进行具体的介绍。机器学习的基本流程为：

1.数据采集和准备

机器学习有一句经典的说法：“数据决定结果，模型只是不断逼近这个上限。”意思是说：数据的质量决定了预测的结果，而模型只是通过不断学习和调整参数，努力逼近数据所隐含的规律或上限。由此可见数据的重要性。

数据的采集和处理是最麻烦也是最重要的一部分内容。针对不同的应用需求对数据所进行的处理也不同。遥感数据虽然均为数值数据，在数据类型上较为单一，但是遥感数据在预处理上是非常复杂和困难的。通常情况下，我们60-70%的时间都是在进行数据处理。数据的质量决定了模型的结果，接下来会对数据进行进一步的阐述说明。

分类：在影像上收集并准备用于地物分类的数据(X)。以及标记样本数据(y)（将地物类别分配给每个像素或区域）。
回归：提取采样点位置对应的遥感数据信息(X)，采样点获取的目标变量（y）。

数据处理包括：数据清洗、特征选择、特征转换、特征提取、数据增强等。

2.数据集的划分

将准备好的数据集划分为训练集和测试集。训练集用于构建分类模型，测试集用于评估模型的性能。数据划分方法：Hold-out、K折交叉验证、分层交叉验证、留一法验证(Leave one out)、时间序列划分、自助采样法等等。

3.模型选择和训练

根据需求选择适当的机器学习算法（如支持向量机、随机森林、卷积神经网络等）来构建分类或者回归模型。将训练集的特征和对应的标签作为输入，通过训练算法对模型进行训练。

4.模型评估

使用测试集评估已训练模型的性能。可以使用各种评估指标来衡量模型的表现。
分类评估指标：使用Recall、Precision、Accuracy、F-score、Kappa
回归：R2、MAPE、RMSE等指标评估模型在回归任务上的表现。

5.参数调优

根据评估结果，对模型进行参数调优或算法选择，以提高地物分类的性能。调参 (炼丹)的方法技巧多种多样。网格搜索，随机搜索、梯度下降、贝叶斯优化等

6.预测

使用训练好的模型对新的遥感影像进行地物分类/参数反演预测。

接下来我将基于传统机器学习方法对每一个步骤做一个简单的介绍，基于Python的Skit-Learn库，部分内容会给出代码。

小时候_可叼了

关注

0
点赞
踩
20

收藏

觉得还不错? 一键收藏
2
评论
机器学习（遥感）| 介绍

以二维空间为例，同一个类型在二维空间中的映射都有其相似性，我们的目的就是在数据映射的特征空间中找出最佳的“决策边界”（Decision Boundary）。图中的三个不同颜色的圈就是不同的决策边界。当任务非常复杂的时候，机器学习算法在特征空间中寻找最佳的可以将不同种类数据分开的决策边界。将（X,Y）数据投影到二维空间，基于最小二乘法拟合一个曲线，这个曲线方程即为线性回归模型，基于该模型将X输入预测Y，评估模型的精度。本文简单介绍机器学习在进行预测的基本流程，之后也将对流程中的每部分进行具体的介绍。
复制链接

扫一扫