读书笔记//《数据科学工程实践》

《数据科学工程实践》揭示了大厂如何运用数据技术解决商业问题,涵盖用户选择分析、时间相关行为建模、LTV模型、场景挖掘等。书中通过实例介绍DCM、生存分析、神经网络LTV模型,并探讨了体系化分析方法与因果推断。
摘要由CSDN通过智能技术生成

出版时间:2021年11月

副标题:用户行为分析、A/B实验、SQLFlow

作者们是一线互联网企业的数据科学家、数据分析师和算法工程师,主要就职于滴滴、部分就职于腾讯、快手等。

点评:神仙下凡布道。感谢大佬们的分享。本书让我领略了大厂如何运用最新数据技术解决商业问题。有点小瑕疵就是,有部分章节的引用案例不是大厂实战,缺少说服力。

再次感叹,平台和机会多么重要啊!

一、数据科学是什么

数据科学包括三要素,商业理解是方向,量化模型是起点,数据技术是道路。

二、观测数据的分析技术

(一)如何分析用户的选择

场景:
家庭旅游时,选择哪种交通方式出行?自驾还是非自驾?飞机、火车、长途汽车、自驾?

DCM的功能:
用来分析”从有限互斥选项集中进行单项选择“的计量模型。选择结果=F(决策者,备选项集合,备选项属性)。

DCM的任务:
1.预测一组决策者的决策行为
2.决策者在做出决策时,衡量不同选项属性的影响
3.了解不同群体如何评价一个备选项的不同属性,以便通过精心设计的策略,修改对个体决策者有重要影响的选项的属性,以主动的方式去改变用户行为。

常用的DCM模型:
在这里插入图片描述

附IIA假设:选择两个备选项的概率之比与其他备选项的存在无关。这条假设一般很难达到。因此,NL比MNL更科学、严谨,应用更广。

python实现:

pip install statsmodels
pip install pylogit

from collections import OrderedDict 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值