出版时间:2021年11月
副标题:用户行为分析、A/B实验、SQLFlow
作者们是一线互联网企业的数据科学家、数据分析师和算法工程师,主要就职于滴滴、部分就职于腾讯、快手等。
点评:神仙下凡布道。感谢大佬们的分享。本书让我领略了大厂如何运用最新数据技术解决商业问题。有点小瑕疵就是,有部分章节的引用案例不是大厂实战,缺少说服力。
再次感叹,平台和机会多么重要啊!
文章目录
一、数据科学是什么
数据科学包括三要素,商业理解是方向,量化模型是起点,数据技术是道路。
二、观测数据的分析技术
(一)如何分析用户的选择
场景:
家庭旅游时,选择哪种交通方式出行?自驾还是非自驾?飞机、火车、长途汽车、自驾?
DCM的功能:
用来分析”从有限互斥选项集中进行单项选择“的计量模型。选择结果=F(决策者,备选项集合,备选项属性)。
DCM的任务:
1.预测一组决策者的决策行为
2.决策者在做出决策时,衡量不同选项属性的影响
3.了解不同群体如何评价一个备选项的不同属性,以便通过精心设计的策略,修改对个体决策者有重要影响的选项的属性,以主动的方式去改变用户行为。
常用的DCM模型:
附IIA假设:选择两个备选项的概率之比与其他备选项的存在无关。这条假设一般很难达到。因此,NL比MNL更科学、严谨,应用更广。
python实现:
pip install statsmodels
pip install pylogit
from collections import OrderedDict