【论文阅读】Optimal Advertising for Information Products

最新推荐文章于 2022-07-04 19:35:48 发布

_beginend

最新推荐文章于 2022-07-04 19:35:48 发布

阅读量427

点赞数 1

分类专栏：学习小记文章标签：概率论线性代数

本文链接：https://blog.csdn.net/qq_33229466/article/details/121846004

版权

github博客文章链接

Abstract

这篇是发表在 EC21 上的文章。考虑的情形是有一个不可知的状态，买家能够选择一个行动，其收益取决于状态和行动。卖家知道真实的状态，想要将状态信息出售给买家。为了让买家愿意付钱购买，卖家可以先免费透露部分信息给买家，改变其对状态的估计，从而让其购买状态信息。买家和卖家都想最大化自己的收益。论文里讨论了卖家的最优机制设计问题，通过优化的角度，给出了特殊情形下问题的解法，同时证明了一般情形下该问题是 NP 难的。

由于论文里涉及到较多凸优化的知识，所以只读懂了一部分。希望等之后学了凸优化之后再来补坑。

Motivation

在生活中有很多这样的例子：例如电影院通过预告片让一些人对电影产生更大的兴趣。注意到虽然提前透露部分信息会让卖家拥有的私有信息量减少，却能让一些人对信息产品产生兴趣，因此来获得更高的收益。

跟传统模型的差别：贝叶斯说服（Bayesian persuasion）中，卖家只考虑买家采取的动作；该模型中卖家还需要考虑具体的收益，即买家付的钱。传统的商品拍卖中，透露信息并不会改变商品本身；该模型中，透露信息会减少卖家包含的私有信息量，即商品的品质。

Model

考虑状态 $\omega\in \Omega=\{1,\cdots,n\}$ ，其服从概率分布 $\mu(\omega)$ ，其中 $\mu$ 是公有信息。具体状态只有卖家能看到，买家对状态的概率分布有一个自己的估计 $\theta\in \Theta\subseteq \Delta\Omega$ 。买家可以选择一个行动 $a\in A$ 。若选择了行动 $a$ 且状态为 $\omega$ ，其收益为 $u(\omega,a)$ 。

买家必须提前公布自己的广告机制。具体来说，广告机制的定义为

Definition 2.1 (Advertising Rule)

广告机制 $\langle S,\pi,\{p_s:s\in S\}\rangle$ 包括

有限大小的信号集合 $S$ 。
$\pi:\Omega\to \Delta S$ 是信号发送机制，即观测到某一个状态后，以特定的概率分布去发送信号。
$\{p_s:s\in S\}$ 表示收到信号 $s$ 后，买家可以选择以 $p_s$ 的价格购买具体状态信息。

那么卖家在观测到状态 $\omega$ 后，先以 $\pi(\omega,s)$ 的概率发送信号 $s$ 。买家可以选择不买具体的状态信息，也可以选择以 $p_s$ 的价格购买。

注意到若买家对状态的估计是 $\theta=(\theta_1,\cdots,\theta_n)$ ，那么在收到信号 $s$ 后，其估计会变为
$\eta^s(\theta)=\frac{(\theta_1\pi(1,s),\cdots,\theta_n\pi(n,s))}{\sum_{\omega=1}^n\theta_\omega\pi(\omega,s)}$
那么买家愿意为购买真实信息付的钱，不超过他知道真实状态 $\omega$ 后的收益减去估计是 $\eta^s(\theta)$ 时的期望收益。具体来说：

Definition 2.2 (Cost of Uncertainty)

假设买家的收益函数为 $u(\omega,a)$ ，估计为 $\eta=(\eta_1,\cdots,\eta_n)\in \Delta \Omega$ ，定义不确定花费为买家不知道真实状态带来的期望损失：
$\begin{aligned} C(\eta)&=E_{\omega\sim \eta}[\max_{a\in A}u(\omega,a)]-\max_{a\in A}E_{\omega\sim \eta}[u(\omega,a)]\\ &=\sum_{\omega=1}^n\eta_{\omega}\max_{a\in A}u(\omega,a)-\max_{a\in A}\sum_{\omega=1}^n\eta_{\omega}u(\omega,a)\\ &=\min_aC_a(\eta) \end{aligned}$
其中 $C_a(\eta)=\sum_{\omega=1}^n\eta_\omega(\max_{a'\in A}u(\omega,a')-u(\omega,a))$ 是关于 $\eta$ 的线性函数，表示采取行动 $a$ 后带来的损失。注意到 $C(\eta)$ 是 $∣ A ∣$ 个线性函数的 $\min$ ，那么 $C(\eta)$ 是一个凹函数。

当买家收到信号 $s$ 后，他愿意购买状态信息当且仅当 $C(\eta^s(\theta))\ge p_s$ ，即购买后能带来非负的收益。

我们假设卖家知道买家状态的概率分布 $\mu(\theta|\omega)$ ，那么选择了广告机制 $\langle S,\pi,\{p_s:s\in S\}\rangle$ 后，其期望收益为
$\sum_{\omega\in \Omega}\mu(\omega)\sum_{\theta\in \Theta}\mu(\theta|\omega)\sum_{s\in S}\pi(\omega,s)\cdot p_s\cdot 1(C(\eta^2(\theta))\ge p_s)$
卖家的目标是找到广告机制来最大化自身期望收益。

Single Buyer Type

首先考虑买家的状态 $\theta$ 是固定的情况。

Concave Closure Formulation

Definition 3.1 (Likelihood ratio)

若买家的估计为 $\theta\in \Delta\Omega$ ，定义其似然比为

最低0.47元/天解锁文章

_beginend

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Optimal Advertising for Information Products

Abstract这篇是发表在 EC21 上的文章。考虑的情形是有一个不可知的状态，买家能够选择一个行动，其收益取决于状态和行动。卖家知道真实的状态，想要将状态信息出售给买家。为了让买家愿意付钱购买，卖家可以先免费透露部分信息给买家，改变其对状态的估计，从而让其购买状态信息。买家和卖家都想最大化自己的收益。论文里讨论了卖家的最优机制设计问题，通过优化的角度，给出了特殊情形下问题的解法，同时证明了一般情形下该问题是 NP 难的。由于论文里涉及到较多凸优化的知识，所以只读懂了一部分。希望等之后学了凸优化之后再
复制链接

扫一扫