0 题目
learning to simmulate
1 背景
ML得到好的模型,去预测,泛化
好的模型需要好的数据
训练数据获取成本高
仿真环境下获取:丰富,安全,成本低
-
真实数据:
参数是真实值,存在偏差(真实-理想),偏差随机,服从一定分布 -
仿真数据:
参数是理想值,生成样本唯一
(为了更真实,要做随机化处理)
随机化方法(域随机,基于先验):
扩大随机化范围,覆盖真实情况
(也覆盖了不可能出现的数据)
如何规划仿真数据的分布?
2 问题
如何合理调整仿真数据的分布?
(如何加噪声,让仿真数据和真实数据接近,提高模型泛化能力)
3 现状与GAP
3.1 匹配真实数据分布
调整仿真数据,不断和真实对比
(类似域适应)
GAP:测的真实数据本身就不准,和真实环境交互
3.2 仿真数据指导
对抗网络,找到对仿真影响最大的参数
G:生成假样本
D&#x