因果推断
文章平均质量分 91
飞翔的七彩蜗牛
搬砖工程师。
Still need hot blood and faith。
要想透彻的理解算法, 一是要看透算法原作者的论文, 二是要读懂相关的优秀源码实现。
行百里者半九十。
展开
-
因果推荐技术在营销和可解释性上的应用学习
关于 Uplift 增益,通用的业务问题可以总结为,在圈定的人群中,营销人员会想知道,新的营销动作 T=1 相比较原始的营销动作 T=0,能带来多少的平均收益(lift,ATE,Average Treatment Effect)。大家会关注新的营销动作是否比原来的更有效。在保险场景下,营销动作主要指的是保险的推荐,比如推荐模块上透出的文案和产品,目标是在各种营销动作和约束条件限制下,找到因营销动作而增益最多的群体,去做定向投放(Audience Targeting)。转载 2024-04-28 17:01:05 · 116 阅读 · 0 评论 -
GCF:在线市场异质治疗效果估计的广义因果森林
在线市场异质治疗效果估计的广义因果森林原创 2024-01-09 18:59:24 · 1180 阅读 · 0 评论 -
时间片轮转
诸如Uber、Lyft、Doordash、滴滴等公司的业务模式均是在下提供相应的供需匹配,因此此种业务模式在进行往往会面对因而带来的网络效应即同一时空下,用户的需求会共享同一批运力池。如果简单对用户进行随机分流,那么对实验组用户的策略不仅会影响实验组本身,同时也会影响对照组下的其他用户, 进而天然违背了A/B/N实验下的即实验组个体不会影响对照组个体。因此为了更好的在下进行科学合理的实验,Doordash采用了,即在同一空间下,以及连续时间分片,实验组对照组轮转生效,主要如下:1. 在进行。转载 2023-11-26 22:21:52 · 312 阅读 · 0 评论 -
SingleTreePolicyInterpreter
EconML库包括策略可解释性工具,如SingleTreePolicyInterpreter,它考虑了干预成本和干预效果,以识别哪些客户可以带来盈利的简单规则。干预通常是有成本的:激励用户成为会员可能会有成本(例如提供折扣)。因此,我们目标是想知道哪些客户的的参与可以最大限度地提高利润。原创 2023-11-19 22:35:46 · 426 阅读 · 0 评论 -
[2021]不确定成本下的处理分配
我们考虑学习如何最优分配成本不确定的治疗方法的问题,并可能因治疗前协变量而异。如果我们需要优先考虑访问不同患者用于不同数量的时间的稀缺资源,或者在营销中,如果我们想要针对公司成本取决于使用折扣多少折扣,则该设置可能出现在医学中。在这里,我们推导出预算约束下的最佳治疗分配规则的形式,并提出了一种实用的基于随机森林的方法,使用来自随机试验的数据或更广泛地说,未混淆的数据来学习治疗规则。原创 2023-10-29 22:30:03 · 231 阅读 · 0 评论 -
因果效应估计:最新进展、挑战与机遇
因果关系自然广泛应用于科学的各个学科,发现变量之间的因果关系并估计感兴趣的因果效应。推断因果关系最有效的方法是进行随机对照试验,将参与者随机分配到治疗组或对照组。由于进行了随机研究,对照组和治疗组之间唯一预期的区别是正在研究的结果变量。然而,在现实中,随机对照试验总是耗时且昂贵。此外,在大多数随机对照试验中还需要考虑伦理问题,这基本上限制了它的应用。因此,观测数据提供了一种诱人的捷径,而不是随机的受控试验。观察数据是由研究人员简单地观察没有干扰的受试者获得的。翻译 2023-10-22 19:36:06 · 180 阅读 · 0 评论 -
未知非参数需求和有限价格变动的动态定价
企业不断创新,引入新的产品,以便在快速变化的商业环境中竞争和更好地定位自己。每年,数十亿美元投资于产品创新和新产品启动(Willemot et al. 2015)。不幸的是,并非所有新产品启动都成功。特别是Willemot等人(2015)指出,每年市场上推出的总新产品中有近15%是不成功的,并在生命周期结束时从货架上起飞。事实上,最近的一项调查指出,超过72%的新产品不能满足其收入目标和属性,如定价失败(Carmichael 2014, Huang et al. 2007)。原创 2023-09-24 17:56:43 · 205 阅读 · 0 评论 -
CausalEGM安装使用
根据观察数据,推断治疗的因果效应对于许多科学和工程问题至关重要,并引起了各个领域的巨大兴趣。了解因果关系的最有效方法是进行随机对照试验(RCT)。然而,RCT 耗时、昂贵且普遍性存在问题。相比之下,观察性研究可以提供有价值的证据并检查“现实世界”环境中的效果。在现实世界的应用中,由于混杂因素引入的选择偏差,治疗通常不是随机分配的。准确估计因果效应涉及处理混杂因素,这可能会影响治疗和结果。未能针对混杂效应进行调整可能会导致估计偏差和错误结论。原创 2023-08-29 18:14:36 · 250 阅读 · 0 评论 -
econml介绍
EconML是一个通过机器学习方法从观察数据中估计heterogeneous treatment effects的Python包。该软件包是的一部分,目的是将最新的机器学习方法与计量经济学结合,从而实现复杂因果推断问题的自动化。机器学习最大的promise之一是在许多领域实现决策的自动化。许多数据驱动的决策场景的核心问题是对heterogeneous treatment effects的估计,也即:对于具有特定特征集的样本,干预对输出结果的causal effect是什么?原创 2023-08-20 21:37:17 · 1352 阅读 · 0 评论 -
观测数据建模
观测数据 / 样本空间覆盖均匀psm。原创 2023-08-06 21:00:13 · 379 阅读 · 0 评论 -
多臂治疗规则的 Qini 曲线(Stefan Wager)
Qini 曲线最初是在营销文献中提出的 [Radcliffe, 2007],绘制了当我们改变预算时处理对治疗最响应的单位的平均策略效应。然后,我们可以通过评估在一系列不同预算级别进行的成本效益练习来量化治疗目标的价值。Qini 曲线已在各种实际应用中采用,以评估受资源约束的处理目标规则的经验性能。二元处理下类似的指标的理论性质,以及曲线摘要下面积的扩展,最近受到了许多作者对统计文献中的关注,包括Imai和Li[2023, 2022],Sun等人[2021]和Yadlowsky等人[2021]。原创 2023-07-30 17:30:17 · 677 阅读 · 0 评论 -
完美匹配:一种简单的神经网络反事实推理学习表示方法
从观测数据估计个体治疗效果1(ITE)是许多领域的一个重要问题。例如,在医学中,我们有兴趣使用过去治疗的人的数据来预测哪些药物会导致新患者更好的结果 [1]。同样,在经济学中,一个潜在的应用程序将是确定某些作业程序将基于过去作业培训程序的结果的有效性。由于两个原因,来自观测数据的ITE估计是困难的:首先,我们从未观察到所有潜在的结果。如果患者接受了治疗她的症状的治疗,我们从未观察到如果患者在同一情况下规定了潜在的替代治疗,会发生什么。原创 2023-07-16 21:43:32 · 719 阅读 · 0 评论 -
DESCN:用于个体治疗效果估计的深度全空间交叉网络
个体层面的因果推理是一种预测分析技术,用于估计单一或多种治疗的个体治疗效果(ITE)。该技术具有广泛的应用,例如识别对患者最有效的药物”,并针对个性化保险产品优化交叉销售 [5]。在电子商务领域也很受欢迎,因为利润驱动的业务,如代金券分布和目标广告。在本文中,我们专注于 ITE 估计任务,其中仅存在单个处理(即处理或未处理3)。该技术具有广泛的应用,例如识别患者最有效的药物 [8],并针对个性化保险产品优化交叉销售 [5]。它在电子商务领域也很受欢迎,作为利润驱动的业务,如凭证分发和目标广告。原创 2023-07-09 22:41:18 · 1307 阅读 · 0 评论 -
使用显式特征的在线交互感知提升网络(EFIN)
作为在线营销的关键组成部分,提升建模旨在准确捕捉不同处理激发不同用户的程度,例如优惠券或折扣,也称为个体治疗效果 (ITE) 的估计。在实际业务场景中,治疗选项可能众多且复杂,不同处理之间可能存在相关性。此外,每个营销实例也可能具有丰富的用户和上下文特征。然而,现有的方法在充分利用对特定处理敏感的处理信息和挖掘特征方面仍然不足。在本文中,我们提出了一个显式特征交互感知提升网络(EFIN)来解决这两个问题。原创 2023-07-02 22:15:23 · 1154 阅读 · 0 评论 -
TensorHouse仓库介绍
TensorHouse 是用于企业运营的参考机器学习和优化模型的集合:营销、定价、供应链等。该项目的目标是为工业、研究和教育目的提供基线实施。原创 2023-06-18 20:56:26 · 339 阅读 · 0 评论 -
预算约束下营销效果优化的端到端框架(快手)
向消费者提供奖励(如现金奖励、折扣、优惠券)是在线平台获取新用户、增加用户参与度、提高平台收益的有效途径[2,3,9,20,21,32,37,38,40,41]。例如,在淘宝[37]中提供优惠券以增加用户活跃度,在Booking[9]中提供促销以提高用户满意度,在快手[2]中使用现金奖励来刺激用户留存,在Uber[40]中使用促销来鼓励用户开始使用新产品。尽管有效,但这些营销活动可能会产生高成本,因此在实际场景中总预算通常是有限的。原创 2023-04-24 19:30:44 · 860 阅读 · 0 评论 -
因果推断16--市场营销中资源分配问题的直接异质因果学习(美团)
营销是提高用户粘性和平台收益的最有效机制之一。因此,各种各样的营销活动被广泛地运用在许多网络平台上。例如,freshppo中易腐产品的降价被用来促进销售(Hua et al. 2021),淘宝交易中的优惠券可以刺激用户活动(Zhang et al. 2021),快手视频平台中的激励措施可以提高用户留存率(Ai et al. 2022)。尽管增加了收益,但营销活动也会消耗大量的营销资源(如预算)。因此,由于数量有限,只有部分个人(如商店或商品)可以被分配营销待遇。原创 2023-04-16 23:05:31 · 1216 阅读 · 0 评论 -
因果推断15--GRFlift: GMV约束下多重处理的提升模型
许多科学领域的核心问题之一是确定一个行为如何影响结果,也就是说,确定一个行为是否有因果效应或治疗效应。这是科学研究和许多学科应用中的一个基本问题。在商业中,流行的研究是,电子商务公司为了制定成功的商业战略,会重点研究广告的植入或对用户的奖励是否会给他们带来利益。相应的方法是因果推断(CI),即确定改变一个变量(例如,治疗)的值是否会影响另一个变量(例如,结果)的值[15,22]。CI的基本方法称为隆起建模[26]。隆升建模在市场营销和保险领域的成功最初引起了人们的注意。原创 2023-03-14 18:51:34 · 955 阅读 · 0 评论 -
因果推断12--dragonnet论文和代码学习
我们从观察数据中考虑因果效应的估计。在随机对照试验(RCT)昂贵或不可能进行的情况下,观察数据往往很容易获得。然而,从观察数据得出的因果推断必须解决(可能的)影响治疗和结果的混杂因素。未能对混杂因素进行调整可能导致不正确的结论。为了解决这个问题,医生除了收集治疗和结果状态外,还收集协变量信息。如果协变量包含所有混杂变量,则可以确定因果效应。我们将在“无隐藏混淆”的背景下贯穿全文。原创 2023-03-09 16:33:34 · 3764 阅读 · 1 评论 -
因果推断10--一种大规模预算约束因果森林算法(LBCF)
向用户提供奖励(例如亚马逊的优惠券,优步的折扣和抖音的视频奖金)是在线平台用来提高用户粘性和平台收入的常用策略。尽管这些营销激励已被证明是有效的,但如果使用不当,会产生不可避免的成本,并可能导致低ROI(投资回报)。另一方面,不同的用户对这些激励措施的反应不同,例如,有些用户从未在没有优惠券的情况下购买某些产品,而另一些用户则无论如何都会购买。因此,如何在预算限制下为每个用户选择合适的激励(即待遇)是一个具有重大现实意义的重要研究问题。在本文中,我们称这种问题为预算约束的治疗选择问题。原创 2023-02-26 17:30:57 · 2271 阅读 · 0 评论 -
因果推断7--深度因果模型综述(个人笔记)
因果关系概念在人类认知中起着重要的作用。在过去的几十年里,因果推理在许多领域得到了很好的发展,如计算机科学、医学、经济学和其他工业应用。随着深度学习的发展,它越来越多地应用于对反事实数据的因果推断。通常,深度因果模型将协变量的特征映射到表示空间,然后设计各种目标函数来无偏估计反事实数据。与现有机器学习中因果模型的研究不同,本文主要对深层因果模型进行了概述,其核心贡献如下:1)总结了多剂量治疗和连续剂量治疗下普遍采用的相关指标;2)我们从发展时间轴和方法分类角度对深层因果模型进行了全面概述。原创 2023-02-19 21:34:39 · 7002 阅读 · 1 评论 -
因果推断6--多任务学习(个人笔记)
我们提出了一种从观察数据推断治疗(干预)的个体化因果效应的新方法。我们的方法将因果推断概念化为一个多任务学习问题;我们使用一个深度多任务网络,在事实和反事实结果之间有一组共享层,以及一组特定于结果的层,为受试者的潜在结果建模。通过倾向-退出正则化方案缓解了观察数据中选择偏差的影响,其中网络通过依赖于相关倾向分数的退出概率对每个训练示例进行减薄。该网络在交替阶段进行训练,在每个阶段中,我们使用两个潜在结果之一(处理过的和控制过的人群)的训练示例来更新共享层和各自特定结果层的权重。原创 2023-01-15 17:19:24 · 1821 阅读 · 0 评论 -
因果推断5--DML(个人笔记)
文章链接我们重新讨论在高维有害参数η0存在的情况下对低维参数θ0的推理的经典半参数问题。我们通过允许η0的高维值来脱离经典设置,从而打破了限制该对象参数空间复杂性的传统假设,如Donsker性质。为了估计η0,我们考虑使用统计或机器学习(ML)方法,这些方法特别适合于现代高维情况下的估计。在实践中,ML方法通过使用正则化来减少方差,并通过过拟合来抵消正则化偏差,从而取得了较好的效果。原创 2023-01-08 16:51:10 · 2048 阅读 · 0 评论 -
因果推断4--Causal ML(个人笔记)
CausalML是一个基于Python的因果学习开源项目。最早为Uber项目定制、内部开源,而后正式成为开源项目。其提供了丰富的模型选择,例如常用的Meta-Learner和因果树模型,方便在实践中作对比和选择。同时还提供例如模拟数据生成、模型可视化、模型评估等一系列配套工具。其目标是用于解决业务实践问题,尤其是在计算速度和数据规模方面能够达到业界标准并持续优化。原创 2023-01-02 17:38:40 · 4198 阅读 · 0 评论 -
因果推断3--DRNet(个人笔记)
从观测数据估计剂量-反应曲线是许多领域的一个重要问题。例如,在医学上,我们感兴趣的是使用过去接受过治疗的人的数据来预测哪些治疗方法和相关剂量会给新患者带来更好的结果。这个问题的核心是一个反事实的问题,也就是说,我们感兴趣的是预测,如果我们在给定的情况下,以特定的剂量给病人特定的治疗,会发生什么。回答这样的反事实问题是一项具有挑战性的任务,需要对潜在的数据生成过程进行进一步假设,或者进行前瞻性的干预实验,如随机对照试验[2 - 4]。然而,进行前瞻性实验既昂贵又耗时,而且在许多情况下,在道德上是不合理的。原创 2022-12-25 22:16:33 · 3045 阅读 · 4 评论 -
因果推断2--深度模型介绍(个人笔记)
S-Learner和T-Learner都不太好,因为S-Learner是把T和W一起训练,在),而T-Learner是各自对T=0和T=1训练两个独立的模型,这样会造成过,与因果关系不大。原创 2022-12-18 20:43:38 · 4053 阅读 · 1 评论 -
因果推断1--基本方法介绍(个人笔记)
因果推断是基于统计学方法刻画变量之间的因果关系。原创 2022-12-11 22:05:52 · 9966 阅读 · 0 评论