自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 电商用户行为分析

一、背景介绍随着互联网的发展,网上购物成为了一种趋势,但同时各大电商平台的竞争也愈发激烈。利用进行发现问题及规律,进行精细化营。结合各个维度的数据以及用户行为进行数据分析,对用户展开有针对性的运营活动,提供个性化,差异化的策略,以实现运营目的。本文利用SQL对2012年11月25日-2017年12月3日的淘宝用户行为数据进行分析,发现其中存在的业务问题,提供建议。二、提出问题1.分析框架指标构建2.提出问题1)什么产品及产品类目销售量最好,及复购率情况2)用户从浏览到最终购买整个过程的流失.

2020-10-17 21:13:13 1277

转载 select_dtypes根据数据类型选择特征

```pythonIn [21]:df.select_dtypes(include=['object']).columns.values Out[21]:array(['term', 'loan_status', 'int_rate', 'emp_length', 'home_ownership', 'verification_status', 'desc', 'purpose', 'title', 'zip_code', 'addr_state', 'issue_d.

2020-10-03 19:10:53 1501

原创 两总体均值之差的推断:匹配样本

相关配对检验这里的案例是斯特鲁普效应的数据,起始就是一组数据是颜色和文字相同,一组数据是颜色和数据不相同,同样的试验者去读两组文字,记录阅读时间(相关配对和独立检验区别就是,这里的实验者是同一组人,而不是两组独立的试验者)第一组"一致"的数据均值为u1,第二组"不一致"的数据均值为u2零假设H0:u1=u2备择假设H1:u1<u2#读取数据data = pd.read_csv('斯特鲁普数据集.csv')#添加自测时间data.loc[24,:] = [19.64,34.24]#

2020-09-17 12:32:18 1227

原创 假设检验

假设检验假设检验原假设备择假设的建立单样本均值检验假设检验原假设备择假设的建立将研究中的假设作为备择假设(希望为真的)例如:某汽车在城市的燃油效率为值24,某研究小组对该燃油系统进行了改进。需要统计结论来支持改进的燃油系统确实比之前的有效。H0:μ≤24H_{0}:\mu \leq 24H0​:μ≤24H1:μ>24H_{1}:\mu \gt 24H1​:μ>24将受到挑战的假设作为原假设例如:某饮料总体均值至少为250ml,我们认为这是符合事实的,这里把不符合事

2020-09-17 11:40:25 136

原创 常见的统计分布

概率中常见的分布概率论中的分布有两种类型离散概率分布:伯努利分布,二项分布,几何分布,泊松分布连续概率分布: 均匀分布,指数分布,正态分布离散分布伯努利分布伯努利分布又叫两点分布,伯努利试验:伯努利试验是在同样的条件下重复地、各次之间相互独立地进行的一种试验。即只先进行一次伯努利试验,该事件发生的概率为p,不发生的概率为1-p。这是一个最简单的分布,任何一个只有两种结果的随机现象都...

2020-04-07 20:38:11 1037

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除