自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 问答 (1)
  • 收藏
  • 关注

原创 MySql学习记录—求连续登录天数

源数据dates:登录时间author_id:登录的作者id/* 最大持续更新天数 1.按作者分组,日期排序后,给行编号*/SELECT author_id, dates, ROW_NUMBER() over (PARTITION BY author_id ORDER BY dates) rn执行结果:如果是连续登录,减去连续的行号,应该得到的是同一个日期SELECT author_id, dates, rn, DATE_SUB(dates,INTERVAL rn

2020-08-22 19:56:30 798

原创 统计学—假设检验之Z检验,T检验

假设检验假设检验的定义假设检验的步骤假设方法Z检验Z检验的适用条件Z检验的类型T检验T检验的适用条件三种类型的T检验假设检验的定义判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成。常用的假设检验方法有Z检验、T检验、卡方检验、F检验等。假设检验的步骤提出假设确定显著性水平(通常α=0.05)计算检验统计量的值做出决策原假设与备择假设:H0H_0H0​ :原假设,称为零假设,希望拒绝的假设。H1H_1H1​ :备择假设,希望接受的假设。假设方法Z检验Z检验的适用

2020-09-03 16:09:06 10687 1

原创 业务侧-到底应该怎么做A/Btest

A/BtestA/Btest是什么A/Btest的重点和特点A/Btest怎么做实验分组检验如果得不到显著的结论怎么办A/Btest是什么A/Btest是在产品正式发版之前,设计两个或更多不同的产品方案,将用户和流量分组,保证用户分组的合理性的情况下,让用户看到不同的产品界面,收集用户的真实反馈,帮助产品决策最优方案。A/Btest的重点和特点重点:用户抽样分组的合理性流量分配的合理性特点:结论可信度高:A/B测试在正式发版之前,对产品方案进行验证,少量的样本量和实际数据来推广到全

2020-09-02 17:28:35 1097

原创 统计学—标准化和归一化的区别

目录数据归一化和标准化是什么标准化和归一化的优缺点和适用范围数据归一化和标准化是什么数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权归一化将数据统一映射到[0,1]的范围内,消除不同数据之间的尺度和单位影响。公式:x∗=x−xminxmax−xminx^* = \frac{x-x_{min}} {x_{max}-x_{min}

2020-09-01 23:28:27 3247

原创 数据分析—面试问题之如何搭建指标体系

这里写自定义目录标题如何搭建指标体系的问题在考察什么?框架功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入如何搭建指标体系的问题在考察什么?建立指标体系的问题,重点在考察对业务的熟悉程度,能不能入职之后立马上手;其次是整体指标的

2020-09-01 22:30:04 1167

原创 机器学习记录—模型评估方法

数据:m个样例的数据集 D={(X1,Y1),(X2,Y2),…(Xm, Ym)}留出法S为训练集,T为测试集,D=S∪T, S∩T=Ø特点:测试集小时,评估结果的方差较大,训练集小时,评估结果的偏差较大,一般情况将2/3 ~ 4/5的样本用于训练,其余用于测试(一般测试集至少包含30个样例)交叉验证法数据集D划分为k个大小相似的 互斥子集,D=D1∪D2∪D3…Dk Di∩Dj=Ø(i≠j),每次用k-1 个子集的并集作为训练集,剩余的子集作为测试集,最终返回的是这 k个测试结果

2020-08-26 16:01:30 159

原创 MySQL学习记录_基础DDL、DML、DQL

DDL(data definition language)数据库、数据表本身的增、删、改:createdropalert:add 增加列modify 修改列的数据类型、长度change 修改列名称DML(data manipulation language) 对表中数据的增、删、改操作: 1. insert into 2. update set 3. deleteDQL(data query language)执行顺序:FROMWHEREGROUP ..

2020-08-16 11:32:09 69

原创 Python数据分析及可视化—亚太地区25所商学院

《商务与经济统计》案例3-3亚太地区的商学院源数据第一题:计算数据集的描述统计量import pandas as pandas//pandas 读取数据data = pandas.read_excel('/Users/python/源数据/亚太地区25所商学院.xlsx')//describe可以描述数据的一些描述性统计信息data.describe()describe的结果mean:平均数std:标准差后面的就是最小值,百分位到最大值了录取名额:25所商学院平均录取名额

2020-07-27 22:42:37 632 3

原创 转岗数据分析—学习准备篇

准备篇必须技能技能学习过程在决定要先停下来一段时间,希望能够转岗数据分析,并且需要学习一些新的知识和技能之后,就开始规划停下来的日子。必须技能首先想要转岗,先得知道,新的岗位有什么要求,需要掌握什么技能。这个去拉勾、boss等看招聘信息就好。招聘的要求,通常就代表了对候选人技能等的考察。还有各类的公众号,知乎,CSDN等等,可收集信息的渠道太多了~首先确定好,需要学习的技能有:一、技能篇PythonSQLspsstableaupower BI分别要知道这些技能是用来做什么的,然后排

2020-07-24 20:06:18 317

原创 开始学习,准备转数据分析岗日常记录—起源

这不是一篇学习笔记,也不是一篇知识分享,只是一篇平平无奇的记录最早对数据感兴趣,其实只是因为数据分析,模型这些东西,听起来特别高大上。用户分层,RFM模型,商家分层······后来一直在做跟商业收入相关的工作,涉及到收入,少不了要看数据,做分析,出报表,可是更多停留在excel处理问题的阶段。再后来,看到爬虫,python越来越火,有点动心~下定决心开始学习数据分析,想转岗,是因为今年部门换了领导,裁掉了整个部门,整体换人。其实在走之前就已经开始看数分的东西,只是裁员的事情上来又推了一把。彻底准备好好学

2020-07-23 23:06:52 68

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除