自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 [SQL知识点]LeetCode详解(175-185)

LeetCode中的sql题目答案及解析

2022-05-19 23:25:26 198 1

原创 [python]基于hanlp的机构识别提取

使用hanlp对知乎回答文本进行机构提取

2022-05-12 23:15:45 891

原创 [python]LDA模型使用流程及代码

lda模型构建完整流程与代码

2022-05-09 19:58:05 20386 35

原创 [统计学知识点]卡方检验

卡方检验往往用于检验某个变量与结果是否存在关联,即是否具有相关性例如物品陈列方式是否影响销量高低首先需要进行假设检验:H0:商品的销量和陈列方式相互独立 陈列方式1 陈列方式2 陈列方式3 合计 高 58 63 52 173 低 42 44 41 127 合计 100 107 93 300 实际观测值如上,下一步是求期望值期望值计算为行合计*列合计/总合计

2022-04-06 11:10:12 1974

原创 数据分析面试题-2

目录数据埋点如何选择买量渠道数据埋点通俗理解:例如公司需要通过员工上下班打卡了解员工上下班时间先决条件:首先需要有埋点系统,自己研发或者是购买第三方。工作流程:step1 需求评审业务方根据业务需求提出获取数据的需求数据分析师了解业务方需求,判断已有数据是否满足需求,以及是否需要埋新的点、业务方需求是否合理,进行评审,敲定需求step2 撰写埋点文档将业务需求转换为埋点文档,提供给埋点工程师,埋点工程师再转化为代码【埋点文档】包括①事件定义;②属性要填

2022-03-19 21:59:29 293

原创 [SQL知识点]开窗函数及习题练习-1

习题网站:https://www.windowfunctions.com/

2022-03-18 22:52:58 957

原创 [阅读记录]《数据分析师求职面试指南》-2

又是写在前面的一些碎碎念,大家都去读这本书!!(●'◡'●)目录第三章 基础知识考察统计及数据分析知识假设检验贝叶斯统计概览模型及数据挖掘知识第四章 编程技能考察熟悉Pythonpandas数据可视化——matplotlib&pyecharts文本处理——jieba&wordcloud第三章 基础知识考察统计及数据分析知识假设检验假设检验中的两类错误①原假设成立的情况下错误地拒绝了原假设;②没有成功拒绝不成立的原假设假设检验中,

2022-03-16 18:22:41 1218

原创 [阅读记录]《数据分析师求职面试指南》-1

写在最前面的一些碎碎念:对于《数据分析师求职面试指南》的阅读记录,大概会按照个人的阅读进度来更,所以每篇结束的地方可能不是章节结束的地方(●'◡'●)目录第一章 面试前的准备第二章 直面数据分析师面试第三章 基础知识考察统计及数据分析知识基础概念:随机变量、分布函数、概率密度函数随机变量的常用特征正态分布与大数定理、中心极限定理假设检验第一章 面试前的准备第一章首先介绍了常见的数据类岗位,具体分为算法工程师、数据挖掘工程师、数据分析师、数据产品经理和数据仓库工

2022-03-15 22:37:10 768

原创 [阅读记录]《统计学导论(第三版)》-1

目录第二章 统计数据的收集、整理与显示一些概念洛伦茨曲线图基尼系数左偏及右偏思考题全面调查是否一定比抽样调查更准确可靠统计分组的要求第三章 数据分布特征的描述测度数据集中趋势的指标测度数据离散程度的指标excel实现描述统计第二章 统计数据的收集、整理与显示一些概念洛伦茨曲线图Lorenz博士把累计频数(或频率)分布曲线用于研究社会财富、土地或收入的分配是否公平,这种累计曲线又称洛伦茨曲线。绘制方法:以人口和收入为例,将两列数据先转

2022-03-14 23:20:04 816

原创 数据分析面试题-1

B站的一些数据分析面试题准备从今天开始利用闲暇时间听一些数据分析岗位的面试题~顺便记录下来方便大家快速get到视频精髓(๑´∀`๑),将以“真题记录-解题思路-扩展知识点”的思路展开。1.如何将某新上线的App做至DAU一千以上思路:分解为拉新与留存两部分 解题:首先,从拉新方面,可以采取三大策略,一是利用已有内部资源,例如一些社群,网站等内部资源进行推广;二是利用资源置换,将App首页banner或其他资源位与曝光量大的平台或软件进行合作,实现外部引流;三是应用市场优化,付费买量推广。从维稳

2022-03-09 23:18:23 246

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除