机器学习
文章平均质量分 88
此星光明
博士,地图制图和地理信息工程专业,主要涉及Google Earth Engine、PIE-Engine、Planetary Computer、AI Earth、中科星图等云平台的遥感生态云计算研究(多源遥感和机器学习相结合),适用建筑、气象、农业、水利等各个专业云计算。2022年云计算领域博客之星TOP3,2023年CSDN博客之星TOP13,华为云云享专家、MVP,阿里云社区、51CTO博客专家博主。
展开
-
GEE机器学习——利用贝叶斯分类器方法进行土地分类和精度评定
贝叶斯分类器是一种基于贝叶斯定理的统计分类方法。它假设特征之间是相互独立的,并根据已知的特征和类别之间的关系,计算出在给定特征条件下每个类别的后验概率,然后选择具有最高后验概率的类别作为预测结果。具体而言,贝叶斯分类器通过以下步骤进行分类:1. 学习阶段:使用已知的特征和对应的类别标签来训练分类器,计算每个类别的先验概率和每个特征在不同类别下的条件概率。2. 预测阶段:对于一个新的样本,根据其特征值计算出在每个类别下的后验概率,然后选择具有最高后验概率的类别作为预测结果。原创 2024-01-11 09:00:00 · 848 阅读 · 0 评论 -
GEE机器学习——利用随机森林RF方法进行土地分类和精度评定
随机森林(Random Forest,RF)是一种集成学习方法,用于解决分类和回归问题。它由多个决策树组成,每个决策树都是一个独立的分类器。通过对每个决策树的预测结果进行集成,随机森林能够提供更准确和稳定的预测。随机森林的主要特点包括:1. 随机特征选择:在构建每个决策树时,随机森林只考虑一部分特征进行划分,这样可以减少特征之间的相关性,并增加每个决策树的多样性。原创 2023-12-19 00:00:00 · 823 阅读 · 0 评论 -
GEE机器学习——利用kNN分类器器方法进行土地分类和精度评定
k最近邻(k-Nearest Neighbors,kNN)分类器是一种常用的机器学习算法,用于对数据进行分类。kNN分类器的原理是基于样本之间的距离度量,通过找到距离待分类样本最近的k个训练样本,并根据这些样本的标签进行投票来确定待分类样本的类别。kNN分类器的具体步骤如下:1. 数据准备:收集并准备用于训练的数据集,确保数据集包含标记好的样本点。2. 特征选择:根据问题的特点选择合适的特征,并对特征进行预处理(如归一化、标准化等)。原创 2023-12-12 19:14:10 · 493 阅读 · 2 评论 -
GEE机器学习——利用分类和回归树(Classification and Regression Trees,CART)土地分类分析
最短距离方法(Minimum Distance)是一种常用的模式识别算法,用于计算样本之间的相似度或距离。该方法通过计算样本之间的欧氏距离或其他距离度量,来确定样本之间的相似程度或差异程度。最短距离方法的具体步骤如下:1. 数据准备:收集并准备用于训练的数据集,确保数据集包含标记好的样本点。2. 特征选择:根据问题的特点选择合适的特征,并对特征进行预处理(如归一化、标准化等)。3. 计算距离:使用合适的距离度量方法(如欧氏距离、曼哈顿距离等),计算待分类样本与训练集中每个样本之间的距离。原创 2023-12-12 19:14:01 · 570 阅读 · 0 评论 -
GEE机器学习——利用梯度决策树Gradient Tree Boost 方法(GBDT/GBRT)进行土地分类和精度测试
梯度提升树(Gradient Tree Boost)是一种集成学习方法,通过串行训练多个决策树来解决回归和分类问题。它通过迭代的方式不断优化模型预测结果,使得每一棵树能够纠正前一棵树的预测误差。Gradient Tree Boost方法的具体步骤如下:1. 数据准备:收集并准备用于训练的数据集,确保数据集包含标记好的样本点。2. 初始化模型:将初始模型设置为一个简单的预测器,如平均值(回归问题)或多数类别(分类问题)。原创 2023-12-12 19:13:50 · 692 阅读 · 2 评论 -
GEE机器学习——利用支持向量机SVM进行土地分类和精度评定
整体上svm分类的整体精度不高,因此我们并不常用词分类作为土地分类的方法。原创 2023-12-12 19:13:33 · 633 阅读 · 0 评论 -
GEE机器学习——Classifier.explain()查看训练模型的过程和变量重要性分析
变量重要性分析是一种用于评估模型中每个特征(变量)对模型性能的影响程度的方法。通过分析每个特征的重要性,可以帮助我们理解模型如何利用不同特征来进行预测,并且可以帮助我们选择最重要的特征,以便更好地解释模型和优化模型性能。在本案例种,使用不同机器学习方法,然后根据该函数对各参与构建模型的变量进行重要性分析,这样最后可以获取各变量的一个数值,最终就可以根据变量重要性来进行模型的优化和变量冗余的处理。原创 2023-12-18 09:00:00 · 280 阅读 · 0 评论 -
GEE机器学习——混淆矩阵Classifier.confusionMatrix()和errorMatrix()和exlain()的用法(js和python代码)
根据训练数据计算分类器的 2D 混淆矩阵(即:重新代入误差)。矩阵的轴 0 对应于输入类,轴 1 对应于输出类。行和列从类 0 开始,并按顺序增加直至最大类值,因此如果输入类不是基于 0 或顺序的,某些行或列可能为空。混淆矩阵是一种用于衡量分类模型性能的工具。它以表格形式展示了模型在不同类别上的预测结果与真实标签之间的对应关系。混淆矩阵的行表示真实标签,列表示预测结果。通过对角线上的元素,我们可以看到模型在每个类别上的正确预测数量,而其他非对角线上的元素则表示模型的误判情况。原创 2023-12-17 10:00:00 · 364 阅读 · 0 评论 -
GEE机器学习——最大熵分类器案例分析(JavaScript和python代码)
创建最大熵分类器。Maxent 用于使用已知存在位置和大量“背景”位置的环境数据来模拟物种分布概率。有关更多信息和引用,请参阅:https://biodiversityinformatics.amnh.org/open_source/maxent/ 和参考出版物:Phillips 等。al.,2004 年物种分布建模的最大熵方法,第二十一届国际机器学习会议论文集。原创 2023-12-16 09:00:00 · 163 阅读 · 0 评论