自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 AB test

**AB test 的介绍:**AB test又称为分组隔离实验,是可以对产品页面的不同设计进行科学实验的方法。例如一个产品页面,有两个不同颜色的按钮,可以通过AB测试两个不同颜色的按钮的点击次数是否存在显著的差异。**AB test 的原理:**假设检验。检验我们提出的假设是否正确,分为实验组和对照组。原假设:实验组和对照组没有显著差异备择假设:实验组和对照组存在显著差异AB test 的流程:选取指标——建立假设——选取实验单位——计算样本量——流量分割——实验周期计算——线上验证——数据验

2021-04-27 17:11:23 1784

原创 假设检验

假设检验中心极限定理如果总体均值为μ\muμ,方差为σ2\sigma^2σ2,我们进行随机抽样,样本容量为nnn,当nnn增大时,则样本均值X‾\overline{X}X ~ N(μ,σ2/n)N(\mu,\sigma^2/n)N(μ,σ2/n)我们会得到如下结论:1、进行多次抽样,则每次抽样会得到一个均值,这些均值会围绕在总体均值左右,呈正态分布。2、当样本容量nnn足够大时,样本均值...

2020-04-07 15:51:46 1218

原创 电商交易数据清洗和分析

电商交易数据清洗和分析数据源:csv文件,某电商的交易数据,先需要对这部分数据进行清洗和分析工具:python(matplotlib/numpy/pandas),jupyter实现数据清洗加载数据分析需要的库import numpy as npimport pandas as pd import matplotlib.pyplot as plt加载数据,加载数据之前先用文本编辑器查...

2020-03-27 15:00:10 1707 4

原创 美国最热的体育运动分析

美国最热的体育运动分析

2020-03-26 14:31:33 368

原创 Hive窗口函数

Hive窗口函数对2017和2018年公司的支付总额按月度累计进行分析,按年度进行汇总select a.year,a.month,a.pay_amount, sum(a.pay_amount) over(partition by a.year order by a.month)from (select substr(dt,1,4) as year, ...

2020-03-26 13:33:58 179

原创 Hive连接查询

Hive连接查询需求1:某年度对用户满意度进行调研分析,找出目标人群。参考实现:2019年购买又退款的客户select a.user_namefrom (select distinct user_name from user_trade where year(dt)=2019) as ajoin (select distinct user_name from user...

2020-03-26 13:25:49 445

原创 Hive基本查询

Hive基本查询需求1:某次经营活动中,商家发起了"异性拼团购",试着针对某个地区的用户进行推广,找出匹配用户。参考实现:选出城市在北京,性别为女的10个用户名select user_namefrom user_infowhere city='beijing' and sex='female'limit 10;注意:如果该表是一个分区表,则WHERE条件中必须对分区字段进行限制。需...

2020-03-26 13:20:29 236

原创 python判断真假身份证号

python判断真假身份证号'''python判断真假身份证号识别一串身份证是否是真实的身份证号码: 公民身份号码是特征组合码,共18位,由十七位数字本体码和一位数字校验码组成。 排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。作为尾号的校验码,是由号码编制单位按统一的公式计算出来的。 身份证第18位(校验码)的计算方法:1、将前面的身份证号码...

2020-03-18 12:16:05 2864

原创 科比相关数据展示

科比相关数据展示

2020-03-12 17:16:47 478

原创 SQL50题

SQL50题#1.查询" 01 "课程比" 02 “课程成绩高的学生的信息及课程分数select student.*,sc_01.CId,sc_01.score,sc_02.CId,sc_02.scorefrom studentLEFT JOIN(select Sid,CId,score from sc where CId='01') as sc_01 on student.SId=sc...

2020-03-11 10:21:55 175

原创 python随机生成电话号码

python随机生成电话号码'''中国电信号段:133,153, 180,181,189,173, 177,149中国联通号段:130,131,132,155,156,185,186,145,176,185中国移动号段:134,135,136,137,138,139,150,151,152,158,159,182,183,184,147,17811位第一位 :1第二位:3,4,5,7...

2020-03-11 09:48:24 3054 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除