通常我们希望 70% 的数据用于训练,20% 用于测试,10% 用于验证。下面你可以在 python 中找到一个示例来批量导出样本。我们更喜欢将 Python api 用于这些目的,因为我们只能为每个任务导出有限数量的点,而 Python 使我们能够自动执行此过程。
import ee
from time import sleep
import math
import numpy as np
import random
from numpy.random import seed
from numpy.random import rand
ee.Initialize()
# 在GEE中产生一个给定大小的抽样内核
def get_kernel (kernel_size):
eelist = ee.List.repeat(1, kernel_size)
lists = ee.List.repeat(eelist, kernel_size)
kernel = ee.Kernel.fixed(kernel_size, kernel_size, lists)
return kernel
# 导入标签图像集
sparcs = ee.ImageCollection('projects/gmap/datasets/manual_qaMasks/sparcs_masks')
# 定义内核大小
kernel_size = 256
image_kernel = get_kernel(kernel_size)
# 指定模型的输入(陆地卫星波段)和响应变量。
opticalBands = ['B2', 'B3', 'B4', 'B5', 'B6', 'B7']
BANDS = opticalBands
RESPONSE = ['cloud','shadow',