自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 数据分析面试——技术面——sql部分

A.理论部分1.sql掌握得如何掌握基本的增删改查,擅长查询语句,能满足数据分析的基本需求。能使用navicat导入数据做分析。2.sql语句执行的基本顺序from–where–(on–join)–group by–having–select–(distinct)–order by–limit3.窗口函数有几类:统计函数,偏移函数,排序函数4.排序函数有哪些,有什么区别?rank() over():113dense_rank() over():112row number() over()

2021-09-28 16:48:38 263

原创 老板说付费用户下降了10%,我要怎么分析?

1.点:首先看看数据是否有错误,保证数据准确性,检查容易出现错误的环节 是否出错,是否有指标口径不一致的情况,排出后可以基本确定是数据异常。2.点—线:拉长时间周期,也就是进行纵向分析,看是否属于周期性变化,有些行业受季节影响很大。(比如可以拉长到上一年,看上一年同期是否有波动)。3.点—线---面:结合时间周期与游标分析进行分析。总和来看数据异常波动的问题。付费用户主要分层新增付费用户与老付费用户,新用户可以细化到渠道,线索转化率,对新老用户的转化率进行核心功能漏斗分析。图解:

2021-06-05 21:59:20 597

原创 2021-06-01

关于指标体系的一些笔记指标体系:就是☞衡量企业业务状态的指标集合好的指标体系的特征:1.科学性:A.指标必须符合业务情况 B.计算方式要符合行业标准2.系统性:体现各指标之间的逻辑关系(活跃用户量*成单转化率)=成单量3.代表性:最能反应突出业务现状的指标4.统一性:各指标被不同部门使用时,需保持指标的计算口径统一指标体系的必要性:1.公司规模:公司规模越大,指标体系越重要2.业务复杂性:流程越复杂,我们越要搭建指标体系3.行业毛利:行业毛利越低,越要搭建指标体系指标体系的作用1.看

2021-06-01 23:56:55 107

原创 爱彼迎的数据分析与建模

Airbnb是AirBed and Breakfast(“Air-b-n-b”)的缩写,爱彼迎是一家联系旅游人士和家有空房出租的房主的服务型网站,它可以为用户提供多样的住宿信息。我们现在对数据进行分析。1.因为price里面的数据有’$‘和’,’,不好运算,我们要替换成空格。calendar['price'] = calendar['price'].str.replace(r"[$,]","").astype(np.float32)calendar.head()并且转换浮点类型。....

2021-02-21 01:58:05 1893 2

原创 1分钟掌握趣味练习:如何实现一个外边界为2,内边界为1的矩阵

python学习,我们不妨用一些有趣的小例子来调剂下?1.首先我们要做一个10X10的元素全为0的矩阵,引入numpy库。import numpy as npt1 = np.zeros(shape=(10,10),dtype='int8')输出结果应该是这样:2.那如何先把边界变为2呢?很简单,我们可以用切片操作。t1[行,列],前面是行,后边是列t1[[0,9]]=2t1[:,[0,9]]=2第0和9行,第0和9列,输出如下:3.好,非常精神!那我们继续那我们把1,8行与列

2021-01-31 00:28:32 261

原创 用Scrapy框架爬取艾尔之光官网并存储到mysql的一些要点

1.一些前言爬虫现在是越来越难学,网站的反爬取越来越厉害,简书,虎牙这些爬虫爬取数据已经越来越难了,在这里我发现了一个网站结构比较老,很适合新手做做简单练习的网页:http://els.ztgame.com/index.shtml我们要爬取它的标题时间标签,并且存储到数据库2.基础要点1.首先要创建Scrapy爬虫项目,这里可以上网查找,我不一一细说了,(这里要注意域名)创建完之后应该会有这些文件:2.我们首先应该去setting.py中设置好参数找到DEFAULT_REQUEST_HE

2021-01-30 16:38:42 225

原创 一小时!使用pandas做一个自己的数据可视化小项目!

pandas小项目1.对数据进行导入2.数据清洗3.数据可视化博客第一次写博客,总之觉得自己学习得留下点什么种一棵树最好是十年前其次是现在1.对数据进行导入(1)数据这东西,大家可以自行准备一下,可以顺便联系下自己的excel水 平,大家可以拿自己比较感兴趣的,比如B站的番剧数据之类的,这里我用一个比较真实的某地的城镇房屋安全系数数据。(2)先把数据和文件,放在一个文件夹,我命名为city_demo,方便我们操作。(3)数据内容:因为涉及到一些隐私,我把地址隐藏了,内容大概是这样

2021-01-30 15:30:06 576 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除