这篇论文分为{domain expansion,hybrid interpolation ,virtual sample selection }三个部分。
**domain expansion:**这个是基于MTD将DXN的数据域确定。也就是,假如一条DXN数据有单日排放量,月排放量,年排放量等数据项,这一部分的功能就是确定一条数据中各个数据项的取值范围。
**hybrid interpolation:**基于这一部分定义的数据生成方法,在domain expansion得到的数据范围内生成一些虚拟数据,扩大范围。
**virtual sample selection:**然后利用多目标粒子群算法对生成的虚拟数据进行优化,提升一下数据质量。
其中domain expansion可以参考:
https://github.com/jsivaku1/kNNMTD
对应的论文是:
https://www.sciencedirect.com/science/article/abs/pii/S0950705121009473?via%3Dihub
这个是将KNN和MTD结合的,你可以看一下他的代码,不关注KNN,分析里面MTD的具体实现代码,再与你复现论文的对于MTD的要求,实现domain expansion,应该可以得到一个域(简单理解为样本的取值范围)。