自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

转载 电商分析需要重点关注的核心指标

电商分析需要重点关注的核心指标引言一、阶段不同,需求不同二、时间不同,侧重不同三、职位不同,视觉不同引言链接@基于“人”“货”“场”的数据指标分类在群面的时候,碰到一题关于针对电商直播业务的数据产品设计。现在想整理下指标的分类。电商的数据指标多,而且很多指标的定义也比较复杂。依据《数据化管理一书》,对于电商分析的核心指标,可以进行如下几个部分的划分:一、阶段不同,需求不同对于一个新电商。积累数据,找准营运方向比卖多少货,赚多少钱更重要。这个阶段可以重点关注流量指标\color{red

2020-10-17 16:28:22 1596

原创 [Python] 电商平台用户的购物篮分析

目录一、背景1. 项目描述 2. 数据描述 二、相关模块 1. 相关模块 2. 数据导入 3. 数据处理 三、商品销售分析 1. 观察畅销品 2. 购物篮分析 2.1 购物篮系数 2.2 指定商品的购物篮系数 2.3 指定商品的人气指数 四、用户行为分析

2020-10-01 10:42:14 3938 1

原创 传统零售业务分析指标整理

前言主要整理了《数据化管理-洞悉零售及电子商务运营》一书的部分内容,将传统零售业分析指标分为了“人”、“货”、“场”、“财务”四大部分。下面是关于各个指标的思维导图,各个指标含有对应的计算公式。...

2020-09-14 11:36:01 918

原创 [Python] A/B Test 项目实践

目录一、前言二、数据导入1. 相关模块2.数据导入三、探索性分析1. 控制/实验组的访问数据对比2. 控制/实验组的注册数据对比3. 控制/实验组的浏览时长分布4. 点击率四、A/B 测试1. 样本观察2. 分层抽样3. 假设检验一、前言字段名解释timestampidgroupactionduration二、数据导入1. 相关模块import pandas as pdimport randomimport seaborn as sn

2020-09-06 20:23:25 968

原创 [推断统计] 求区间估计:枢轴量法

目录一、区间估计二、枢轴量三、常见的枢轴量四、枢轴量法一、区间估计区间估计:是一种由样本数据计算两个点的规则,通常表示为一个公式,目的是形成一个以很高的置信程度包含总体参数θθθ的区间。所得到的随机区间(随机是由于用于计算区间两个端点的样本观测值是随机变量)称为置信区间,包含被估参数的概率(抽样前)称为置信系数。二、枢轴量一种求参数θθθ的置信区间的方法是求出一个枢轴统计量,该统计量是关于样本值和单个参数θθθ的函数,其分布不依赖于任何未知参数。【例子】设X1,X2,⋯,XnX_1,X_

2020-09-05 18:45:48 22045

转载 [连续随机变量] 几个连续概率分布整理

目录一、连续随机变量二、整理一、连续随机变量连续随机变量定义:连续随机变量是指随机变量XXX的可能取值为直实线上一个或多个区间中不可数无穷多个点的所及变量。连续随机变量和离散随机变量的区别一般是基于它们的累积分布函数的不同。离散型随机变量的累积分布函数是阶梯函数,而连续型随机变量的累积分布函数是:一个关于yyy的单调递增函数。连续随机变量的诶性:均匀分布、正态分布、Γ\GammaΓ型分布、威布尔分布和β\betaβ型分布。二、整理...

2020-09-04 22:15:52 596

原创 [离散随机变量] 几个离散概率分布整理

几个离散概率分布的整理。

2020-09-03 18:28:31 943

原创 [推断统计] 点估计-极大似然法学习

目录一、极大似然原理的理解二、样本的似然函数三、求解步骤一、极大似然原理的理解      通俗的理解,极大似然原理含义就是,世界上之所以会发生某些事件,是因为它发生的概率大。      例如有一个博客的例子是:假设引起XXX现象和YYY现象的原因有AAA和BBB两种。假设:在AAA原因情况下,XXX现象发生的概率远大于YYY现象发生的概率。在BBB原因情况下,YYY现象发生的概

2020-09-02 23:42:19 300

原创 [推断统计] 矩估计学习

矩估计(method of moments)是由英国统计学家Karl.Pearson在20世纪初提出来的,它的中心思想就是用样本矩去估计总体矩。

2020-08-29 19:52:32 634

转载 [数理统计] 分布族谱图

2020-08-24 11:21:28 677

原创 [一些理解] 什么是随机变量

设随机试验的样本空间为S,X=X(e)是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量。本质是关于基本事件的函数,自变量是基本事件,因变量是函数值。

2020-08-22 19:31:22 5092

原创 [Python] 用K-means聚类算法进行客户分群

k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局

2020-08-21 19:53:08 9420 9

转载 [Python] pandas与numpy的数据类型对应关系

2020-08-20 22:33:40 4593

原创 [Python] 解决seaborn绘图无法显示中文等问题

目录1.相关模块2.解决sns显示问题3.效果显示seaborn是基于matplotlib的基础上进行封装的。话不多说,上代码1.相关模块import pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns2.解决sns显示问题生成sns样式sns.set(palette="muted", color_codes=True) # seaborn样式一些配置plt.rcParams['font.sans-s

2020-08-20 17:37:46 14035 4

转载 [转] MySQL经典面试题30道!

原文章地址请点击目录汇总关系型数据库1.1 什么是关系型数据库?1.2 关系型数据库有什么优势?MySQL 数据库2.1 什么是 SQL2.2 什么是MySQL?2.3 MySQL 和 MariaDB的区别?基础数据类型3.1 MySQL 有哪些数据类型?3.2 CHAR 和 VARCHAR的区别?3.3 VARCHAR(50) 能存放几个 UTF8 编码的汉字?3.4 int(10) 和 bigint(10) 能存储的数据大小一样吗?存储引擎相关问题.

2020-08-20 11:05:38 166

转载 [Python] 组合数据类型(集合/列表/元组/字典)

组合数据类型一、集合类型(Set)1.去重功能2.集合运算3.集合内置方法二、序列类型1.列表类型(List)1.1 访问列表1.2 列表内置方法2.元组类型(Tuple)2.1 创建元组2.2 访问元组2.3 元组不可变三、字典类型(Dictionary)1. 创建字典2.访问字典3.修改字典4.字典内置方法本文主要想整理一些python常用的组合数据类型的方法。资料主要来源于菜鸟教程。一、集合类型(Set)集合(set)是由一个或数个形态各异的大小整体组成的,构成集合的事物或对象称作元素或是成员

2020-08-19 17:53:42 940

原创 [搜索算法] 线性查找/二分查找

最基本的查询算法是线性查找,属于无序查找算法。思路是从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值kkk相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。

2020-08-17 17:56:58 656

原创 [数据结构] 树和二叉树学习

[数据结构] 树和二叉树学习思维导图

2020-08-17 11:38:50 146

原创 [Python][pmdarima] 季节性ARIMA模型学习

前段时间参与了一个快消行业需求预测的项目。其中,用到了移动平均法、ARIMA、Xgboost等方法进行预测,现在打算总结一下ARIMA。因为项目的销售数据属于私密数据,这里用网上找的一份案例数据用于展示。

2020-08-16 12:48:32 17802 37

转载 [CSDN] 公式编辑教程

链接如下:https://www.zybuluo.com/codeep/note/163962

2020-08-11 20:49:36 276

原创 [Python] DataFrame的遍历问题

[Python] Datframe的遍历问题一、问题引出二、解决问题一、问题引出导入数据,生成时间序列。io = 'D:/PythonProject/ARIMA/sales_data.csv'data = pd.read_csv(io, header=0, index_col='time')time_series = pd.DataFrame(data)time_series.index = pd.to_datetime(time_series.index)# 输出前5个数据,此时Date为时

2020-08-09 15:57:58 1781 1

原创 阿里天池:Airbnb短租房数据集分析

共享,通过让渡闲置资源的使用权,在有限增加边际成本的前提下,提高了资源利用效率。随着信息的透明化,越来越多的共享发生在陌生人之间。短租,共享空间的一种模式,不论是否体验过入住陌生人的家中,你都可以从短租的数据里挖掘有趣的信息。基于Airbnb 2019 年 4 月 17 日公开的北京地区数据,进行行政区划和短租房类型的维度拆分,对短租房供给、需求等进行探索性分析。

2020-08-07 10:27:41 9758 24

原创 [snownlp] 对Airbnb短租客的评论进行情感分析

使用snownlp对Airbnb短租客的评论进行情感分析一、数据来源二、数据读取及预处理三、基于情感倾向值的情感分析1.snownlp介绍2.进行情感分析一、数据来源数据来源:https://tianchi.aliyun.com/competition/entrance/231715/information采用了reviews_detail.csv表的数据。本文主要关注房子id和房客评论;使用了python3.7.1,PyCharm社区版2019.2。二、数据读取及预处理相关模块。

2020-08-06 21:11:34 2239 5

原创 [Python] 解决PyCharm安装snownlp失败问题

解决PyCharm安装snownlp失败一、问题引入二、解决方法一:pip install --upgrade snownlp三、解决方法二:pypi下载本地安装四、解决方法三:国内镜像一、问题引入      在PyCharm上的Terminal上使用pip install snownlp 出现了以下错误:ERROR: THESE PACKAGES DO NOT MATCH THE HASHES FROM THE REQUIREMENTS FI

2020-08-06 11:26:55 9249 2

原创 [Airbnb] 用Python统计含有中文评论的行,用词云图进行可视化

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2020-08-04 17:55:59 1793

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除