Persuading Customers to Buy Early: The Value of Personalized
这篇论文看得太久了,实在看不下去,逼一下自己。
在互联网商业中,由于企业可以频繁更改价格,因此消费者面临两种风险:未来价格下降&未来商品数量不足。
假设
- 垄断企业销售同质商品
- 消费者数量固定,不会在模型中间忽然离开或进入系统
- 企业和消费者对于企业到底是高数量企业(H-type)还是低数量企业(L-type)一开始都未知,先验一致。
- 企业在获得产品数量确定信息之前制定价格。
- 企业消费者一共进行两个阶段
符号
- 两个阶段企业制定的价格为 p 1 , p 2 p_1,p_2 p1,p2,且 p 1 > p 2 p_1>p_2 p1>p2
- 消费者对产品的估值(产品对消费者的效用)服从 F F F分布, F ( v ) F(v) F(v)表示消费者对产品估值 ≤ v \leq v ≤v的比例。估值为 v v v的消费者称之为‘v-消费者’
- 企业商品数量 Q Q Q是随机变量,只能是高数量( Q = q H Q=q_H Q=qH)或低数量( Q = q L Q=q_L Q=qL),两者的先验概率为: P ( H ) \mathbb{P}(H) P(H), P ( L ) \mathbb{P}(L) P(L)。
- 企业需要制定信号机制 Σ \Sigma Σ。 S S S表示企业可以给消费者传递的信号空间, S v S_v Sv表示给v-消费者传递信号的集合, s v s_v sv表示对单个v-消费者传递的信号, s v ∈ S v s_v\in S_v sv∈Sv
- 通过企业传递的信号以及决定的第一、二阶段价格,v-消费者决定购买方案 x v x_v xv。当 x v = 0 x_v=0 xv=0,消费者在任何阶段都不购买商品;当 x v = 1 x_v=1 xv=1,消费者在第一阶段购买;当 x v = 2 x_v=2 xv=2,消费者在第二阶段购买。
- 但并不是消费者想买就能买到,还要考虑各个时期的商品数量。 A i ( v ) A_i(v) Ai(v)表示当某个v-消费者决定在第 i i i阶段购买且能够买到。
总结:企业先制定两个阶段的价格 p 1 , p 2 p_1,p_2 p1,p2。然后在了解到自己商品确切数量后向消费者传递信号,消费者接收到信号后决定买不买?什么时候买?如果决定要买,那么当时商品数量足够,就可以获得商品,否则交易失败。
由此,v-消费者的效用可以表示为:
U
v
(
x
,
a
,
p
1
,
p
2
)
=
I
(
x
∈
{
1
,
2
}
)
⋅
(
v
−
p
x
)
P
(
A
x
(
v
)
∣
s
,
x
v
=
x
)
(1)
U_v(x,a,p_1,p_2)=\mathbb{I}(x\in \{1,2\})\cdot (v-p_x)\mathbb{P}(A_x(v)|s,x_v=x) \tag{1}
Uv(x,a,p1,p2)=I(x∈{1,2})⋅(v−px)P(Ax(v)∣s,xv=x)(1)
传统消费者效用就是“产品对消费者的效用
−
-
−消费者花费 ”,但此处还需要乘以商品是否可得的概率。所以,根据Bayesian Nash Equilibrium每个消费者的最优购买决策可以写为:
x
v
(
s
v
,
p
1
,
p
2
)
∈
arg
max
x
∈
{
0
,
1
,
2
}
U
v
(
x
,
a
,
p
1
,
p
2
)
(2)
x_v(s_v,p_1,p_2)\in\arg\max_{x\in\{0,1,2\}} U_v(x,a,p_1,p_2) \tag{2}
xv(sv,p1,p2)∈argx∈{0,1,2}maxUv(x,a,p1,p2)(2)
在给定一个均衡,企业两阶段的期望收入可以表示为:
R
(
x
)
=
E
[
p
1
D
1
+
p
2
D
2
]
(3)
R(x)=\mathbb{E}[p_1D_1+p_2D_2] \tag{3}
R(x)=E[p1D1+p2D2](3)
其中随机变量
D
t
=
∫
v
∈
V
I
(
A
t
(
v
)
)
d
F
(
v
)
D_t=\int_{v\in V}\mathbb{I}(A_t(v))dF(v)
Dt=∫v∈VI(At(v))dF(v),表示在t阶段获得商品的消费者数量(第t阶段卖出的商品数量)。企业的目标就是
R
e
(
Σ
,
p
1
,
p
2
)
=
max
x
R
(
x
)
R_e(\Sigma,p_1,p_2)=\max_x R(x)
Re(Σ,p1,p2)=xmaxR(x)
此外,受到企业传递的信号后,v-消费者对于企业类型的后验概率
μ
(
s
v
)
\mu(s_v)
μ(sv)可以表示为:
μ
(
s
v
)
=
P
(
H
∣
S
v
=
s
v
)
=
P
(
S
v
=
s
v
∣
H
)
P
(
S
v
=
s
v
∣
H
)
P
(
H
)
+
P
(
S
v
=
s
v
∣
L
)
P
(
L
)
\mu(s_v)=\mathbb{P}(H|S_v=s_v)=\frac{\mathbb{P}(S_v=s_v|H)}{\mathbb{P}(S_v=s_v|H)\mathbb{P}(H)+\mathbb{P}(S_v=s_v|L)\mathbb{P}(L)}
μ(sv)=P(H∣Sv=sv)=P(Sv=sv∣H)P(H)+P(Sv=sv∣L)P(L)P(Sv=sv∣H)
结论
最优公开(public)机制
在这种情况下,所有的信息都是公开的。
Theorem 1
(i) 不提供信息,并将价格制定为
p 1 = P max { F ˉ − 1 ( q L ) , p m } + P ( H ) p m p_1=\mathbb{P}\max\{\bar{F}^{-1}(q_L),p^m\}+\mathbb{P}(H)p^m p1=Pmax{Fˉ−1(qL),pm}+P(H)pm
p 2 = p m p_2=p^m p2=pm
是一个最优公开信号机制。
( p m p^m pm是无限制一次静态博弈价格, p m = arg max p p F ˉ ( p ) p^m=\arg\max_pp\bar{F}(p) pm=argmaxppFˉ(p))
(ii) 提供全部信息,并将价格制定为
p 1 = max { F ˉ − 1 ( q L ) , p m } p_1=\max\{\bar{F}^{-1}(q_L),p^m\} p1=max{Fˉ−1(qL),pm}
p 2 = p m p_2=p^m p2=pm
是另一个最优公开信号机制
(iii) 在任意一个最优公开信号机制下,企业的收入均为
R p u b l i c = P ( L ) p 1 F ˉ − 1 ( p 1 ) + P ( H ) p 2 F ˉ − 1 ( p 2 ) R_{public}=\mathbb{P}(L)p_1\bar{F}^{-1}(p_1)+\mathbb{P}(H)p_2\bar{F}^{-1}(p_2) Rpublic=P(L)p1Fˉ−1(p1)+P(H)p2Fˉ−1(p2)
其中 p 1 = max { F ˉ − 1 ( q L ) , p m } p_1=\max\{\bar{F}^{-1}(q_L),p^m\} p1=max{Fˉ−1(qL),pm}, p 2 = p m p_2=p^m p2=pm
p
r
o
o
f
:
\mathcal{proof}:
proof:
最优非公开(private)机制
在这种情况下,企业可以分别给不同的消费者提供三种不同的信息:‘Buy Now’(买),‘Wait for Period 2’(等待),‘Do not Buy’(不买)。
价格策略(PS1)
p 1 = F ˉ − 1 ( q L ) p_1=\bar{F}^{-1}(q_L) p1=Fˉ−1(qL), p 2 p_2 p2满足:
d d p 2 p 2 F ˉ ( p 2 ) = F ˉ ( v ˉ ) \frac{d}{dp_2}p_2\bar{F}(p_2)=\bar{F}(\bar v) dp2dp2Fˉ(p2)=Fˉ(vˉ)
v ˉ = sup { v ∈ V : σ H ( v ) < 1 } \bar v=\sup\{v\in V:\sigma_H(v)<1\} vˉ=sup{v∈V:σH(v)<1}
( σ H ( v ) = P ( S v = B u y ∣ H ) \sigma_H(v)=\mathbb{P}(S_v=Buy|H) σH(v)=P(Sv=Buy∣H),即H-type企业给v-消费者传递“买”信号的概率。具体形式见公式(4))
信号策略(PS2)
(a)如果 Q = q L Q=q_L Q=qL,企业给那些价值大于 p 1 p_1 p1的消费者传递“买”的信号,给其他人传递“不买”的信号。
(b)如果 Q = q H Q=q_H Q=qH:
(i)对于 v > p 1 v>p_1 v>p1的消费者,企业按照 σ H ( v ) \sigma_H(v) σH(v)的概率向v-消费者传递“买”的信号,以 ( 1 − σ H ( v ) ) (1-\sigma_H(v)) (1−σH(v))的概率向消费者传递“等待”的信号
(ii)对于 p 2 < v < p 1 p_2<v<p_1 p2<v<p1的消费者,企业向其传递“等待”的信号
(ii)对于 v < p 2 v<p_2 v<p2的消费者,企业向其传递“不买”的信号
由此非公开信号得到的收入为:
R p r i v a t e = P ( H ) p 2 F ˉ ( p 2 ) + P ( H ) ( p 1 − p 2 ) F ˉ ( v ˉ ) + P ( L ) ∫ v = p 1 v ˉ ( v − p 1 ) d F ( v ) + P ( L ) p 1 q L R_{private}=\mathbb{P}(H)p_2\bar{F}(p_2)+\mathbb{P}(H)(p_1-p_2)\bar F(\bar v)+\mathbb{P}(L)\int_{v=p_1}^{\bar v}(v-p_1)dF(v)+\mathbb{P}(L)p_1q_L Rprivate=P(H)p2Fˉ(p2)+P(H)(p1−p2)Fˉ(vˉ)+P(L)∫v=p1vˉ(v−p1)dF(v)+P(L)p1qL
讨论: (我以为)Bayesian Persuading的核心就是通过增加自身某方面的可信度(概率),从而增加另一个更关键概率的提升。例如,一个嫌疑犯是罪犯的先验为0.3,辩护律师可以通过“如果是罪犯我一定会说是罪犯,即
P
(
律
师
认
为
是
罪
犯
[
g
]
∣
嫌
疑
犯
是
罪
犯
[
g
u
i
l
t
y
]
)
=
1
\mathbb{P}(律师认为是罪犯[g]|嫌疑犯是罪犯[guilty])=1
P(律师认为是罪犯[g]∣嫌疑犯是罪犯[guilty])=1”的方式,增加
P
(
嫌
疑
犯
是
罪
犯
[
g
u
i
l
t
y
]
∣
律
师
认
为
是
罪
犯
[
g
]
)
\mathbb{P}(嫌疑犯是罪犯[guilty]|律师认为是罪犯[g])
P(嫌疑犯是罪犯[guilty]∣律师认为是罪犯[g])后验概率。
P
(
g
u
i
l
t
y
∣
g
)
=
P
(
g
∣
g
u
i
l
t
y
)
P
(
g
u
i
l
t
y
)
P
(
g
∣
g
u
i
l
t
y
)
P
(
g
u
i
l
t
y
)
+
P
(
g
∣
i
n
n
o
c
e
n
)
P
(
i
n
n
o
c
e
n
t
)
\mathbb{P}(guilty|g)=\frac{\mathbb{P}(g|guilty)\mathbb{P}(guilty)}{\mathbb{P}(g|guilty)\mathbb{P}(guilty)+\mathbb{P}(g|innocen)\mathbb{P}(innocent)}
P(guilty∣g)=P(g∣guilty)P(guilty)+P(g∣innocen)P(innocent)P(g∣guilty)P(guilty)
(糖水不等式)
在这个例子中,最重要的是尽量让消费者在第一阶段买,而这只能在
v
>
p
1
v>p_1
v>p1中争取。因此,主要分析这一部分的消费者。 对于H企业,需要在传递“买”这个信号时,增加消费者认为自己是L-type的概率,这样消费者才会有在第一阶段购买的趋向,那就是说需要增加
σ
L
(
v
)
=
P
(
S
v
=
B
u
y
∣
L
)
\sigma_L(v)=\mathbb{P}(S_v=Buy|L)
σL(v)=P(Sv=Buy∣L),最高就是给那些能买的消费者全部传递“买”的信号,而为了收入最大,L-type的企业最好是在第一阶段全部卖出,因此
p
1
=
F
ˉ
−
1
(
q
L
)
p_1=\bar{F}^{-1}(q_L)
p1=Fˉ−1(qL)。
那么对于H-type的企业,消费者在第一阶段购买商品,当且仅当:
v
−
p
1
≥
(
v
−
p
2
)
P
(
H
∣
S
v
=
B
u
y
)
v-p_1\geq (v-p_2)\mathbb{P}(H|S_v=Buy)
v−p1≥(v−p2)P(H∣Sv=Buy)
根据贝叶斯公式:
P
(
H
∣
S
v
=
B
u
y
)
=
P
(
H
)
σ
H
(
v
)
P
(
H
)
σ
H
(
v
)
+
P
(
L
)
σ
L
(
v
)
\mathbb{P}(H|S_v=Buy)=\frac{\mathbb{P}(H)\sigma_H(v)}{\mathbb{P}(H)\sigma_H(v)+\mathbb{P}(L)\sigma_L(v)}
P(H∣Sv=Buy)=P(H)σH(v)+P(L)σL(v)P(H)σH(v)
将
σ
L
(
v
)
\sigma_L(v)
σL(v)代入可以得到
σ
H
(
v
)
=
min
{
P
(
L
)
P
(
H
)
(
v
−
p
1
p
1
−
p
2
)
,
1
}
(4)
\sigma_H(v)=\min\{\frac{\mathbb{P}(L)}{\mathbb{P}(H)}(\frac{v-p_1}{p_1-p_2}),1\} \tag{4}
σH(v)=min{P(H)P(L)(p1−p2v−p1),1}(4)
这个时候,第一阶段的价格、
v
>
p
1
v>p_1
v>p1消费者的信号策略都已经清楚。还需要求第二阶段价格制定策略。先写出此时H-type企业的收入
R
p
r
i
v
a
t
e
H
=
p
2
F
ˉ
(
P
2
)
+
(
p
1
−
p
2
)
F
ˉ
(
v
ˉ
)
+
(
p
1
−
p
2
)
∫
v
=
p
1
v
ˉ
σ
H
(
v
)
d
F
(
v
)
=
p
2
F
ˉ
(
P
2
)
+
(
p
1
−
p
2
)
F
ˉ
(
v
ˉ
)
+
P
(
L
)
P
(
H
)
∫
v
=
p
1
v
ˉ
(
v
−
p
1
)
d
F
(
v
)
\begin{aligned} R_{private}^H&=p_2\bar F(P_2)+(p_1-p_2)\bar F(\bar v)+(p_1-p_2)\int_{v=p_1}^{\bar v}\sigma_H(v)dF(v)\\ &=p_2\bar F(P_2)+(p_1-p_2)\bar F(\bar v)+\frac{\mathbb{P}(L)}{\mathbb{P}(H)}\int_{v=p_1}^{\bar v}(v-p_1)dF(v) \end{aligned}
RprivateH=p2Fˉ(P2)+(p1−p2)Fˉ(vˉ)+(p1−p2)∫v=p1vˉσH(v)dF(v)=p2Fˉ(P2)+(p1−p2)Fˉ(vˉ)+P(H)P(L)∫v=p1vˉ(v−p1)dF(v)
为使收入最大化,对
p
2
p_2
p2求导为零就得到上述对
p
2
p_2
p2的约束。
以上是从Bayesian Persuading的角度得到了一个机制,但这不一定是最优的机制接下来就需要证明,这个机制还是最优的。
Theorem 2
如果 q L ≤ F ˉ ( p m ) q_L\leq\bar F(p^m) qL≤Fˉ(pm),那么上述非公开机制就是最优信号机制。并且 R p r i v a t e > R p u b l i c R_{private}>R_{public} Rprivate>Rpublic。
Corollary 1
对于任意 q L > F ˉ ( p m ) q_L>\bar F(p^m) qL>Fˉ(pm),如果 R p r i v a t e > R p u b l i c R_{private}>R_{public} Rprivate>Rpublic,那么上述非公开机制就是最优信号机制;否则,公开机制就是最优信号机制。
p
r
o
o
f
:
\mathcal{proof}:
proof: