数据分析
文章平均质量分 57
今天我有更博学吗?
数据分析爱好者
展开
-
[Tableau]输入“开始日期”和“结束日期”过滤仪表盘日期范围
前言Tableau里提供了日期筛选方法:常用的日期筛选器如下两个图:图一:拖动日期范围作为筛选器图二:选择相对日期但这样跟其他筛选器放在一起显得并不美观,同时两种方法都存在一定的缺点:针对图一拖动日期范围方法,拖动的时候需要十分小心才能拖到想选择的日期。针对图二选择相对日期方法,假如想看上个月的某个星期,这个筛选器比较难做到,选择性并不灵活。这里我提供一个方法可以输入“开始日期”和“结束日期”来选择仪表盘中的日期范围。一、创建两个日期参数一个是开始日期,一个是结束日期,操作如下图原创 2021-02-21 23:34:01 · 1459 阅读 · 1 评论 -
【Tableau】时间维度
文章目录前言具体做法一、创建参数二、创建计算字段三、把日期字段拖入表中,并显示参数前言数据库里存的信息是具体到日期,利用Tableau建立一个时间维度的参数,以便运营人员可以自由按照日、周、月维度看信息具体做法一、创建参数二、创建计算字段原表中国日期为Date三、把日期字段拖入表中,并显示参数勾选【显示参数】把参数放到最上面方便看,这里看到参数的是三个值。并且如下是选择默认值“日”的展示效果。时间维度选择“周”:时间维度选择“月”:...原创 2021-02-12 15:22:29 · 1053 阅读 · 1 评论 -
用分类算法预测手机价格区间,用网格搜索调参
文章目录前言一、了解数据二、建立模型前准备1.分训练集测试集2.定义一个函数输出每个算法的结果3.网格搜索优化算法二、建立模型1.逻辑回归模型2. KNN3. 决策森林4. 随机森林总结前言数据为二手手机的各个性能的数据,最后根据这些性能得到3个价格区间,作为这些二手手机售出的价格区间。注意:该数据集已经经过预处理,可以直接用于预测价格区间。一、了解数据battery_power:电池一次可储存的总能量,单位为毫安时blue :是否有蓝牙clock_speed:微处理器执行指令的速度du原创 2021-01-03 16:35:35 · 3425 阅读 · 4 评论 -
泡泡玛特营收可视化报表
12月11日,泡泡玛特上市,发行价为38.5港元,开盘价77.1港元,较发行价大涨100.26%,市值突破千亿港元。在2019年就听说泡泡玛特全年营收高达16.8亿了,我身边也有很多朋友入坑不能自拔。本人收集了泡泡玛特的招股书的数据,并对营收数据部分做的一个可视化作品,营收数据会从产品维度和渠道维度去分析。作品展示:作品链接主页:展示主要信息之余,还有三个按钮能跳转到对应的表格明细数据总体营收明细:产品营收明细:渠道营收明细:总结:泡泡玛特在前两年保持着每年200%+的营收增原创 2020-12-20 17:26:52 · 1299 阅读 · 0 评论 -
分析各渠道广告,建立评分模型以及找到优质渠道的特性
文章目录官方描述一、观察数据二、提出问题以及实现方法2.1 哪个渠道综合结果数据较优质2.1.1 排除有相关性的数据2.1.2 数据归一化2.1.3 加权评分2.2 优质渠道有什么共性特征2.3 分析各个广告特征与平均注册率和订单转化率之间的关系2.4 聚类分析广告投放效果2.读入数据总结观察数据:官方描述公司近三个月(30天)大力投放广告,累计投放的渠道有889,每个渠道的客户性质也可能不同,比如在优酷视频投广告和今日头条投放广告,效果可能会有差异。现在需要对广告效果分析实现有针对性的广告效果测量和优原创 2020-12-17 23:30:40 · 1223 阅读 · 0 评论 -
在SQL中创建时间维度表
如标题,用sql语句生成一张从2020年1月1日至今日的日期表,这是考察在SQL中创建时间维度表。这里采用循环的方式:先创建一个表格,只有日期字段,字段类型为datecreate table ab_date(date date);DELIMITER $$CREATE PROCEDURE create_date ()BEGINdeclare indexdate Date;set indexdate=date(“2020-01-01”);while indexdate <= curdat原创 2020-12-11 20:21:14 · 2288 阅读 · 0 评论 -
[Python]学生成绩分析, 可视化以及建模--在线教育行业分析案例连载3
文章目录前言一、导入库二、数据处理三、分别计算RFM信息1、聚合所需要的信息2、计算每个学生的购买课程总价3、计算RFM各指标3.1 R3.2 F3.3 M3.5 计算每个用户的RFM总结前言该文章为连载的第三篇:学生成绩分析某家在线教育机构拥有自己开发的教育产品VLE,该教育机构提供了他们四个学期里,开展的七门课的数据,接下来我会根据这些数据,为该教育机构做一系列的数据分析,包括用户的RFM模型、用户分群特征、用户成绩分析等等。该教育机构部分数据库结构如下如下这三篇文章为:用户成绩分析做原创 2020-12-04 15:13:08 · 4376 阅读 · 6 评论 -
[Python]实现用户注册数据的分析,计算复购率,回购率注销率等--在线教育行业分析案例连载2
该文章为连载的第二篇:用户注册信息分析经营状况前言某家在线教育机构拥有自己开发的教育产品VLE,该教育机构提供了他们四个学期里,开展的七门课的数据,接下来我会根据这些数据,为该教育机构做一系列的数据分析,包括用户的RFM模型、用户分群特征、用户成绩分析等等。该教育机构部分数据库结构如下...原创 2020-11-30 23:43:20 · 1190 阅读 · 1 评论 -
[Python]RFM用户分类模型, 加matplotlib可视化数据--在线教育行业分析案例连载1
文章目录前言一、导入库二、构造价格数据三、分别计算RFM信息1、聚合所需要的信息2、计算每个学生的购买课程总价3、计算RFM各指标3.1 R3.2 F3.3 M3.5 计算每个用户的RFM总结前言某家在线教育机构拥有自己开发的教育产品VLE,这里该教育机构提供了他们四个学期里,开展的七门课的数据,接下来我会根据这些数据,为该教育机构做一系列的数据分析,包括用户的RFM模型、用户分群特征、用户成绩分析等等。该教育机构部分数据库结构如下如下这一篇文章为:用户的RFM模型先简单介绍一下RFM模型:原创 2020-11-29 12:00:45 · 827 阅读 · 0 评论 -
【分析案例】手机产品双十二节日分析python 可视化
文章目录前言一、查看数据1.引入库2.观察数据二、处理数据1.日期数据2.其他数据三、数据可视化1.时间趋势变化1.1 一个月内每天的变化趋势1.2 一天内每小时的变化趋势2.转化漏斗图2.1 非节日转化率2.2 节日转化率3.各转化率的对比分析总结前言数据为阿里巴巴手机电商平台的交易数据,该数据集有12256906条记录,时间是从2014-11-18到 2014-12-18. 现在拿这个数据练习可视化,展示交易数据在某个时间维度的变化趋势,以及绘制漏斗图查看各流程的转化率。一、查看数据1.引原创 2020-11-23 17:18:03 · 431 阅读 · 0 评论 -
hive电商数据分析
创建表:CREATE TABLE tbDate(dateID string,theyearmonth string,theyear string,themonth string,thedate string,theweek string,theweeks string,thequot string,thetenday string,thehalfmonth string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY .原创 2020-11-21 15:48:57 · 984 阅读 · 0 评论 -
[业务题]货拉拉数据分析岗简答题, 评估优惠券促销活动的收益效果,评估哪种优惠券对企业更优
如题:货拉拉会经常给用户发放不同的折扣券。假设有三种类型的折扣券A, B, C ;这三种折扣券同时通过APP直接发放给玩家们,且每张折扣券的优惠程度,有效日期大致一样。用户可以在一次同时使用多种优惠券,货拉拉可以根据折扣券码得知哪张优惠券被使用, 货拉拉还拥有这些用户的个人数据,例如年龄,性别,订单记录等。如何量化折扣券使用户额外消费的金额? 以及如何通过数据分析得知哪种折扣券最能吸引用户再次使用货拉拉下单?问题一:如何量化折扣券使用户额外消费的金额找到这次的发放人数(干预总人数)、这次优惠券有效期内原创 2020-11-19 09:35:24 · 1756 阅读 · 0 评论 -
把本地文件上传到远程服务器,在hive中创建表并导入数据
文章目录一、scp命令上传文件/文件夹二、macOS登录远程服务器三、进入hive窗口四、hive中创建表五、向创建表中导入txt文件一、scp命令上传文件/文件夹可以选择:上传一个文件:scp -r /path/filename username@servername:/path上传一个文件夹:scp -r /path/folder username@servername:/path 打开一个文件夹遍历上传里面所有文件:scp -r /path/folder/* user原创 2020-11-17 23:20:04 · 1099 阅读 · 0 评论 -
SQL实现广告数据多维度的提取
本来想把三个表导入数据库做练习,无奈raw_data的表太大(我的电脑性能太差),就先用python处理,根据二八法则,尝试选择占top80%浏览量的广告做分析,发现占浏览量为11%的广告占据了80%的广告位,把这11%的广告筛选出来后数据有...原创 2020-11-16 15:20:37 · 895 阅读 · 0 评论 -
SQL实现对销售表现重要指标的计算,对用户特征分层看销售贡献,并统计消费的二八法则
文章目录前言数据分析思路SQL代码查看数据1.整体运营指标SQL代码计算指标1.整体运营指标2.读入数据总结前言数据现在有两个表:order_info 和 user_infoorder_info有如下字段:字段名字段解释order_id主键:订单编号user_id用户编号isPaid是否支付price订单总价格paidTime支付时间user_info有如下字段字段名字段解释user_id主键:用户编号原创 2020-11-14 21:23:50 · 1686 阅读 · 0 评论 -
A/Btest (A/B测试)的营销策略效果分析
目录前言一、数据来源二、观察数据1.引入库2.读入数据3.观察数据三、计算效果方法1.公式计算方法2.Python函数计算总结前言本分析以支付宝营销活动为例,通过广告点击率指标比较两组营销策略的广告投放效果。一、数据来源来自阿里天池:数据二、观察数据1.引入库代码如下:# import librariesimport pandas as pdimport numpy as nppd.set_option('float_format', lambda x: '%.4f' % x)原创 2020-11-02 13:27:02 · 1496 阅读 · 1 评论 -
Python做多维度分类的聚合运算、环比、同比
目录1.目标:2.背景:3.观察数据:4.计算步骤、思路5.总体聚合运算6.多维度分类的聚合运算学习产出:1.目标:按月求三个重要指标:用户数销量销售额在每个维度的总和,或者每个分类的环比、同比。2.背景:一家国外品牌的自行车生产公司,在中国拥有三个代理商帮助销售其品牌产品,该品牌的自行在中国车十分畅销,在各个地区都有其用户。该场景下的维度有:时间维度产品维度地区维度代理商维度消费者维度以月为单位就算,计算各维度中某分类的总和、同比、环比3.观察数据:每一行.原创 2020-10-31 16:00:06 · 3411 阅读 · 4 评论