笔记
这里是哒哒
这个作者很懒,什么都没留下…
展开
-
假设检验
假设检验中心极限定理如果总体均值为μ\muμ,方差为σ2\sigma^2σ2,我们进行随机抽样,样本容量为nnn,当nnn增大时,则样本均值X‾\overline{X}X ~ N(μ,σ2/n)N(\mu,\sigma^2/n)N(μ,σ2/n)我们会得到如下结论:1、进行多次抽样,则每次抽样会得到一个均值,这些均值会围绕在总体均值左右,呈正态分布。2、当样本容量nnn足够大时,样本均值...原创 2020-04-07 15:51:46 · 1218 阅读 · 0 评论 -
电商交易数据清洗和分析
电商交易数据清洗和分析数据源:csv文件,某电商的交易数据,先需要对这部分数据进行清洗和分析工具:python(matplotlib/numpy/pandas),jupyter实现数据清洗加载数据分析需要的库import numpy as npimport pandas as pd import matplotlib.pyplot as plt加载数据,加载数据之前先用文本编辑器查...原创 2020-03-27 15:00:10 · 1707 阅读 · 4 评论 -
美国最热的体育运动分析
美国最热的体育运动分析原创 2020-03-26 14:31:33 · 368 阅读 · 0 评论 -
Hive窗口函数
Hive窗口函数对2017和2018年公司的支付总额按月度累计进行分析,按年度进行汇总select a.year,a.month,a.pay_amount, sum(a.pay_amount) over(partition by a.year order by a.month)from (select substr(dt,1,4) as year, ...原创 2020-03-26 13:33:58 · 179 阅读 · 0 评论 -
Hive连接查询
Hive连接查询需求1:某年度对用户满意度进行调研分析,找出目标人群。参考实现:2019年购买又退款的客户select a.user_namefrom (select distinct user_name from user_trade where year(dt)=2019) as ajoin (select distinct user_name from user...原创 2020-03-26 13:25:49 · 445 阅读 · 0 评论 -
Hive基本查询
Hive基本查询需求1:某次经营活动中,商家发起了"异性拼团购",试着针对某个地区的用户进行推广,找出匹配用户。参考实现:选出城市在北京,性别为女的10个用户名select user_namefrom user_infowhere city='beijing' and sex='female'limit 10;注意:如果该表是一个分区表,则WHERE条件中必须对分区字段进行限制。需...原创 2020-03-26 13:20:29 · 236 阅读 · 0 评论 -
python判断真假身份证号
python判断真假身份证号'''python判断真假身份证号识别一串身份证是否是真实的身份证号码: 公民身份号码是特征组合码,共18位,由十七位数字本体码和一位数字校验码组成。 排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。作为尾号的校验码,是由号码编制单位按统一的公式计算出来的。 身份证第18位(校验码)的计算方法:1、将前面的身份证号码...原创 2020-03-18 12:16:05 · 2864 阅读 · 0 评论 -
科比相关数据展示
科比相关数据展示原创 2020-03-12 17:16:47 · 478 阅读 · 0 评论 -
SQL50题
SQL50题#1.查询" 01 "课程比" 02 “课程成绩高的学生的信息及课程分数select student.*,sc_01.CId,sc_01.score,sc_02.CId,sc_02.scorefrom studentLEFT JOIN(select Sid,CId,score from sc where CId='01') as sc_01 on student.SId=sc...原创 2020-03-11 10:21:55 · 175 阅读 · 0 评论 -
python随机生成电话号码
python随机生成电话号码'''中国电信号段:133,153, 180,181,189,173, 177,149中国联通号段:130,131,132,155,156,185,186,145,176,185中国移动号段:134,135,136,137,138,139,150,151,152,158,159,182,183,184,147,17811位第一位 :1第二位:3,4,5,7...原创 2020-03-11 09:48:24 · 3054 阅读 · 2 评论