【牛津大学博士论文】生成建模:解决模型错误指定和差分隐私中的开放问题...

2e7b163269bd9b45af317df8f2ee432c.png

来源:专知
本文约1000字,建议阅读5分钟
在本论文中,我们通过展示四项不同的研究,探讨了模型错误指定和差分隐私下的生成建模。

110be8949b6473bedf93925c946c7e8a.png

生成建模已经成为人工智能的一个热门应用。然而,当生成模型被错误指定,或当生成模型估计器被修改以遵守差分隐私等隐私概念时,模型性能可能会受到负面影响。在本论文中,我们通过展示四项不同的研究,探讨了模型错误指定和差分隐私下的生成建模。

我们首先介绍了生成建模的相关工作。随后,我们深入探讨了在模型错误指定和差分隐私挑战下研究生成建模的必要性。

作为初步贡献,我们考虑了用于密度估计的生成建模。处理模型错误指定的一种方法是放宽模型假设。我们展示了这一方法在非参数模型中也具有帮助作用。具体而言,我们研究了一种最近提出的非参数准贝叶斯密度估计器,并发现其强模型假设是有限数据集下表现不佳的原因。我们提出了一种自回归扩展,放宽模型假设,以允许先验特征依赖关系。

接下来,我们考虑了用于缺失值填补的生成建模。在将当前深度生成填补方法分类为Rubin [1976]引入的不可忽略缺失模型类之后,我们扩展了变分自编码器的公式,使其根据深度生成建模文献中尚未研究过的不可忽略缺失模型类进行分解。这些模型显式地对缺失机制进行建模,以防止在缺失值非随机情况下的模型错误指定。

然后,本论文集中于提高差分隐私下的合成数据生成。为此,我们提出了对差分隐私合成数据样本进行差分隐私重要性采样的方法。我们观察到,生成模型越好,重要性采样的帮助越大。接着,我们通过考虑差分隐私扩散模型,进一步提高数据生成质量。我们识别了显著提高DP图像生成器性能的训练策略。

我们在论文的最后进行了讨论,包括对所展示工作的贡献和局限性,并提出了未来工作的潜在方向。

6c711bf25b4d7f245b64fbb78a8df03a.png

651e525c887d22617268b99d34581fa1.png

关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。

0c99a8dc405bceffb9d74ae4840f067a.png

新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值