- 博客(164)
- 资源 (12)
- 收藏
- 关注
原创 随机森林算法(Random Forest)R语言实现
随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和回归上表现出了十分惊人的性能,因此,随机森林也被誉为“代表集成学习技术水平的方法”。
2023-02-25 14:57:34 14502 35
原创 Python地理数据处理 27:基于Arcpy批量处理已矫正的worldclim2.1未来气候数据——投影、重采样、多波段拆分以及裁剪
前面我写了一篇关于如何使用ArcGIS自带的Python工具处理worldclim数据的多波段数据的文章,而这只是处理该数据的其中一步。要想得到满足要求的数据,还需要其他操作,依次为投影为指定投影坐标系(Albers)、重采样为1000m空间分辨率、多波段拆分以及裁剪。今天我把以上所有的相关操作基于一套代码进行演示,可以实现一键操作。并且我使用的是已矫正的worldclim2.1未来气候数据,该数据排除了异常值。
2024-09-30 17:09:59 482 1
原创 【数据修复指南】手把手教你使用线性插值填补各类遥感数据缺失—Modis、Landsat和Sentinel
之前我写了使用年内均值或者中值来填补数据控制的方法,这种方法较为简单,不够精确。因此,我在这里结合所学知识提供一种线性插值的方法。线性插值假设在两个已知数据点之间的数据变化是均匀的,通过直线连接这两个点,并据此估算中间点的值。这种方法在数据缺失较少且缺失点两侧都有有效数据时效果较好。本研究以成都市成华区作为感兴趣区,选择MODIS和Landsat8数据进行线性插值。
2024-09-28 20:44:57 627
原创 Python地理数据处理 26:基于Arcpy批量提取多波段遥感影像中的所有单波段影像(以worldclim2.1未来气候数据为例)
最近我在使用worldclim未来气候数据时,遇到了一个问题。未来气候数据为包含19个单波段的多波段影像,因此如果一个个地进行提取肯定会比较麻烦。于是我用Arcpy编写了一个小代码,来实现批量提取。
2024-09-25 11:22:09 261
原创 【数据优化】GEE基于年内数据填补遥感缺失数据
在遥感影像分析中,我们经常会遇到由于云层遮挡、传感器故障等多重因素导致的图像数据缺失问题。为了解决这一挑战,常用的技术包括利用一年内数据的均值或最小值进行填充,以及采用线性插值等方法。在本文中,我们将探索如何借助 Google Earth Engine (GEE) 这一强大工具,以简洁高效的方式实现这些数据填充技术。这里我先使用年内数据填充法对多年数据进行填充。
2024-09-22 15:22:09 535
原创 【数据优化】基于GEE平台筛选与合成高质量植被指数(以若尔盖NDVI去除拼接缝为例)
在合成植被指数(如NDVI、EVI)的过程中,我们经常遇到影像中异常值的问题,例如影像拼接缝。尽管可以采用多种滤波和平滑算法来处理这些异常值,但这些方法往往只能缓解问题,而不能从根本上消除异常区域的异常值。数据质量是决定数据合成效果的关键因素。如果数据质量不佳,即使使用再高级的优化算法,也无法彻底解决问题。此外,在进行数据合成时,通常会使用数月的数据,但这些数据的质量往往参差不齐,这会影响合成效果。因此,通过筛选出质量较高的数据进行合成,可以有效减少合成数据的异常。
2024-09-20 14:29:31 458
原创 关于全能型AI和专业型AI的未来发展趋势的看法
全能型AI和专业型AI各有其市场优势和潜在用户群体。全能型AI,如OpenAI预计推出的“草莓”模型,以其多功能性和广泛的应用场景,能够吸引那些寻求一站式解决方案的用户和企业。这种类型的AI适合于需要处理多种任务和问题的环境,能够提供快速、灵活的响应,从而在一定程度上提高工作效率和用户体验。全能型AI的跨行业适应性为它开辟了更广阔的市场空间,尤其是在资源有限或需要快速解决方案的情况下表现出其独特的价值。
2024-09-04 10:35:15 405 1
原创 【R语言】基于Biomod2集成平台探究物种分布区的构建流程(SDMs)
我为什么想要写这个内容呢?其实我已经想了很久了,但是一直没有把所有的代码给理清楚,此外这将是我之后研究的主要方向。本博客讲述了如何基于Biomod2集成平台构建物种分布模型的全流程,以及我在使用该模型时的一些心得,同时还有我提供的一些小福利(一键处理代码),可以十分快捷的帮助你完成SDMs的构建,写出你的中英文论文。
2024-09-02 17:48:21 872 4
原创 【R语言】基于多模型的变量重要性图 (Variable Importance Plots)
好久没有更新博客了,正好最近在帮老师做一个项目,里面涉及到了不同环境变量的重要性制图,所以在这里把我的理解进行分享,这应该是大家都可能遇到的问题。笔者水平有限,大家发现什么问题可以给我指出。变量重要度图(Variable importance plots)可以非常直观的展示各个变量在模型中的重要度,从而可以更好的理解和解释所建立的模型。
2024-08-22 22:56:36 1326
原创 【反者道之动,弱者道之用】统计学中的哲理——回归均值 Regression to the mean
回归均值(Regression toward the Mean/Regression to the Mean)指的是如果变量在其第一次测量时是极端的,则在第二次测量时会趋向于接近平均值的现象。在金融学中, 回归均值是指股票价格无论高于或低于价值中枢(或均值)都会以很高的概率向价值中枢回归的趋势。 根据这个理论,股票价格总是围绕其平均值上下波动的。
2024-06-26 11:14:10 675
原创 【R语言】地理探测器模拟及分析(Geographical detector)
🗺️🔍地理探测器是一种用于探测空间分异性以及揭示其背后驱动因子的统计学方法。它由中国科学院地理科学与资源研究所的王劲峰研究员提出,并已被广泛应用于社会环境因素和自然环境因素的影响机理研究。地理探测器模型的核心思想是,如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。通过计算和比较各单因子的q值,可以判断它们对空间分异性的解释力,q值越大表示解释力越强。
2024-06-21 14:27:25 3311 7
原创 【R语言】数据可视化分析和统计检验——线性和线性混合效应模型
最近听了北京理工大学王蓓老师关于R语言的讲座,受益匪浅,现在把自己学习的内容和收获进行记录和分享。
2024-06-16 15:31:10 1761
原创 GEE26:遥感数据可用数据源计算及条带号制作
🌍✨📚今天读了一篇关于遥感数据可用数据源计算及条带号制作的文章,结合着自己的理解,添加了一些内容。
2024-05-27 19:49:33 422
原创 【R语言】堆叠折线图绘制大揭秘
大家好,今天我来分享一个超实用的技能——如何用R语言绘制堆叠折线图!👩💻👨💻希望这个分享对大家有所帮助,如果你有任何问题,欢迎在评论区留言交流!一起进步,一起成长!🌟
2024-05-27 14:19:55 422
原创 【数据挖掘】基于GEE平台按采样点提取Landsat 植被指数时间序列秘籍
🚀🚀🚀大家好,今天我要分享的是如何使用Google Earth Engine (GEE) 平台,针对特定的采样点,提取LANDSAT 8卫星数据中的植被指数时间序列。本代码主要包括三种植被指数:NDVI、EVI和NDPI。
2024-05-26 21:58:44 230
原创 R语言数据处理(四)
从指定文件夹中读取所有 .xlsx 文件,并提取每个文件中特定行和列的数据,然后将这些数据合并到一个最终的数据框中,最后将合并后的数据写入新的 .xlsx 文件中。
2024-05-26 21:27:50 536
原创 R语言:Mantel Test分析与绘图
Mantel test分析对两个矩阵相关关系进行检验。可以用在生态学上,用来检验群落距离矩阵(如 Bray-Curtis distance matrix)和环境变量距离矩阵(如 pH, 温度 或者地理位置的差异矩阵)之间的相关性(Spearman、Pearson)。Mantel test的相关性系数越大,p值越小,则说明环境因子对微生物群落的影响越大。同时,mantel test的偏分析(partial Mantel test等)可排除环境因子之间自相关的干扰。
2024-05-26 11:11:51 7463
原创 【数据挖掘】批量导出逐日、逐月、逐季节和逐年的遥感影像(以NDVI为例)
🌟🌟🌟最近很多小伙伴们私信我,问我如何高效导出遥感数据,从逐日到逐季度,我都有一套自己的方法,今天就来和大家分享一下!大家有什么疑惑,可以评论区留言,相互学习,共同进步。
2024-05-25 22:21:57 614
原创 【数据分析】基于GEE平台的随机森林回归分析(以重庆市为例)
这是一个在GEE平台上使用随机森林算法实现回归的一个案例,本研究所涉及的因变量为随机数,自变量包括:NDVI、EVI、kNDVI、NDBI、NDWI、相关气候因子和地形因子,实现因子重要性评估,并模拟因变量分布图。
2024-05-17 16:22:16 438 2
原创 GEE25:获取年均LAI(叶面积指数)和FPAR(光合有效辐射分量)
MODIS/061/MOD15A2H数据组合了叶面积指数 (LAI) 和光合有效辐射分数 (FPAR) 产品是分辨率为 500m 的 8 天复合数据集。该算法从Terra传感器8天内的所有采集数据中选择了“最佳”像元。
2024-05-14 08:58:05 691
原创 【数据挖掘】Landsat8时间序列线性插值获取NDVI指数
今天分享一个对Landsat8数据进行线性插值并提取NDVI的方法。我想有很多人对遥感数据质量都有很大的困惑,主要是由于气候或者遥感探测器本身的影响,而导致部分时间段的遥感数据质量较差,所以,我们使用的线性插值的方法以提升遥感数据质量。
2024-05-03 13:54:59 382
原创 GEE23:基于植被物候实现农作物分类
今天分享一个有意思的文章,用于进行农作物分类。文章提出了一个**灵活的物候辅助监督水稻(PSPR)制图框架**。主要是通过提取植被物候,并自动对物候数据进行采样,获得足够多的样本点,再使用随机森林等机器学习方法进行分类。这种方法有效解决了样本量不足或者样本位置不够精确的问题,并且分类结构相较于之前的方法更高。我认为这是一种比较有意思的文章,当然这种方法还可以用到其他植被类型分类中。
2024-03-30 22:13:27 1402 4
原创 GEE22:基于目视解译的土地利用分类(随机森林监督分类)
进行土地利用分类首先需要获取高分辨率的卫星或航空影像数据,这些影像可以来自于多种数据源,对影像进行预处理。使用GEE的绘图工具,在图像上绘制不同的土地利用类别,例如农田、森林、城市等构建样本集合。为每个绘制的类别定义属性分配相应的土地利用类别标签。使用选择的分类算法对训练数据进行模型训。常见的分类算法包括决策树、随机森林、支持向量机(SVM)、深度学习等。每种算法都有其优点和限制,可以根据任务的复杂性和数据特性来选择算法。
2024-03-29 22:29:22 1034 3
原创 R语言:多值提取到点
dataset中使用的采样点为度分表的小数形式,然而所需要提取的Bio数据为投影坐标系,所以这里需要为dataset采样点定义一个相同的投影坐标系,才能实现采样。
2024-03-07 19:52:53 883 2
原创 R语言:箱线图绘制(添加平均值趋势线)
今天有时间把之前使用过的一些代码和大家分享,其中箱线图绘制我认为是非常有用的一个部分。之前我是比较喜欢使用origin进行绘图,但是绘制的图不太好看,并且需要进行不断调整,不太方便,所以开始使用R语言进行绘制。
2024-02-05 15:37:32 2158
原创 GEE 24:基于GEE实现高空间分辨率物种分布模型的模拟
使用未分类的卫星图像作为预测变量,以高空间分辨率对物种分布进行建模。对于本例,我们从 GBIF获得了 6 月份(繁殖季节中期)的雪貂(Hylocichla mustelina)观测数据集。首先,我们加载数据并将分析的空间分辨率设置为 90 m。我们对原始 99,939 个观测值进行了精简,每个像素保留一个,从而获得了 34,880 个用于建模的观测值。
2023-12-16 16:57:27 1060
原创 GEE 23:基于GEE实现物种分布模型之随机森林算法(Random Forest)
这是在 Google Earth Engine 中对物种分布和栖息地适宜性进行建模的指南。本例主要使用随机森林方法构建物种分布模型,当然也可以使用其他非参数分类方法。GEE 中有多种可以实现的非参数分类算法。其中包括随机森林、支持向量机、分类和回归树、最大熵和梯度提升。
2023-11-29 22:14:27 1175
原创 GEE 22:基于GEE实现物种分布模型之分布数据预处理【工欲善其事必先利其器】
工欲善其事必先利其器:基于GEE实现SDMs之物种分布数据的预处理。
2023-11-26 22:07:51 843
原创 GEE21:基于MODIS数据获取逐年GPP、EVI和FVC数据
基于MODIS数据获取植被逐年的GPP、EVI和植被覆盖度,植被覆盖度作为全球气候变化模型和描述生态系统的重要参数,通过有效获取植被进行光合作用面积的大小以及植被生长的茂盛程度,主要表现为地表植被的覆盖状态。
2023-11-20 20:20:52 1599
原创 R语言:利用biomod2进行生态位建模
在这里主要是分享一个不错的代码,喜欢的可以慢慢研究。我看了一遍,觉得里面有很多有意思的东西,供大家学习和参考。
2023-11-19 19:21:52 2073 2
原创 GIS杂记(三):MaxEnt模型中的图像地理范围不匹配【全网最好的方法,没有之一】
一般在使用全国的的生物气候变量时,由于其地理范围一致,因此不会出现地理范围不匹配的问题。但是,当加入其他影响因子的时候,如海拔、坡度和坡向等时,就会出现地理范围不匹配的问题。ArcGIS中能够进行图像范围的裁剪,但是裁剪后的范围可能存在1个或2个栅格的差异,这样也无法导入模型中成功运行,因此需要对ArcGIS中的裁剪工具进行一定的修改。SDMToolbox包中有批量裁剪栅格图像的工具,但是也需要对其参数进行修改,修改方式与ArcGIS自带的裁剪工具一致。
2023-11-19 10:48:53 1592 1
原创 Python地理数据处理 25:基于arcpy批量操作(七)
arcpy批量处理数据第六弹:批量裁剪指定文件夹下的多个子文件中的tif影像;重分类;栅格计算器(乘法)
2023-11-16 16:47:20 416
原创 GEE20:获取地面站点的遥感图层的采样值
去年由于实验需要,想通过GEE获取遥感图层的采样值,但是多次尝试后任无法实现。最近通过查询,终于找到的获取采样点的方法,现在将其记录在此,并与大家分享。
2023-11-13 14:48:56 216
原创 随机森林算法(Random Forest)的二分类问题
数据一共包含了35723个样本,214个特征,选择其中前1000个样本进行模型构建(数据太大,这样更快一些)。查看一下数据分布情况,是不是符合一定的规律,如正态性之类的。数据集分割为训练集和测试集。选择ntree为90即可。选择mtry=5即可。
2023-10-24 16:43:28 1371 2
原创 GEE19:基于 Landsat 8 的常见植被指数逐年获取【去云&波段计算】
本文主要介绍常见的植被物候,及其GEE代码,通过去云,波段计算等方法获取高清植被指数影像。
2023-10-18 21:03:41 1185
中国人民大学431金融学综合2011-2022真题.pdf
2023-12-13
Anusplin插值软件
2023-03-24
支持向量机的实现(包括线性核函数、高斯核函数等),以及基于SVM的垃圾邮件分类实现过程(MATLAB)
2022-07-06
基于神经网络的多分类问题(手写体识别)(matlab)
2022-07-06
SIFGPP每日数据集
2022-06-08
日光诱导叶绿素荧光(SIF)数据
2022-06-08
NASA Panoply
2022-06-06
为什么用GEE计算EVI得到的值超出了[-1, 1]的区间?
2023-10-28
TA创建的收藏夹 TA关注的收藏夹
TA关注的人