自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 客户流失及用户画像分析

1 项目背景在今天产品高度同质化的阶段,市场竞争不断加剧,企业与企业之间的竞争,主要集中在对客户的争夺上。“用户就是上帝”促使众多企业不惜代价去争夺尽可能多的新客户。但是,在企业不惜代价发展新用户的过程中,往往会忽视老用户的流失情况,结果就导致出现新用户在源源不断的增加,辛苦找来的老用户却在悄无声息的流失的窘状。如何处理客户流失的问题,成为一个非常重要的课题。那么,我们如何从数据汇总挖掘出有价值的信息,来防止客户流失呢?2 项目目标挖掘出影响用户流失的关键因素,预测客户的转化效果以及用K-means

2021-01-15 01:38:13 5697 8

原创 K-Means聚类分析--RFM模型

1 项目介绍携程作为中国领先的综合性旅行服务公司,每天向超过2.5亿会员提供全方位的旅行服务,在这海量的网站访问量中,我们可分析用户的行为数据来挖掘潜在的信息资源,进行用户画像,从而提供更好的运营服务和完善产品设计,提升用户体验。2 数据准备2.1数据集来源: 携程旅行网: 云海竞赛平台数据集包括:训练集和测试集。训练集为2016.05.15-2016.05.21期间一周的访问数据,测试集为2016.05.22-2016.05.28期间一周的访问数据。本篇文章主要讨论的是聚类分析,所以只用训练集。

2021-01-14 14:15:33 6582 4

原创 利用逻辑回归进行用户流失预测分析

1.项目背景客户流失是所有与消费者挂钩行业都会关注的点。因为发展一个新客户是需要一定成本的,一旦客户流失,除了浪费拉新成本,还需要花费更多的用户召回成本。所以,电信行业在竞争日益激烈当下,如何挽留更多用户成为一项关键业务指标。为了更好运营用户,这就要求要了解流失用户的特征,分析流失原因,预测用户流失,确定挽留目标用户并制定有效方案。2.明确分析问题分析用户特征与流失的关系。从整体情况看,流失用户普遍具有哪些特征?尝试找到合适的模型预测流失用户。针对性给出增加用户黏性、预防流失的建议。3.

2021-01-14 02:33:32 5583 20

原创 商品零售购物篮分析

1 案例背景购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究顾客的购买行为,从而辅助零售企业制定营销策略的一种数据分析方法。通过对商场销售数据进行分析,得到顾客的购买行为特征,并根据发现的规律而采取有效的行动,制定商品摆放、商品定价、新商品采购计划,对增加销量并获取最大利润有重要意义。本案例使用Apriori关联规则算法实现购物篮分析,发现超市不同商品之间的关联关系,并根据商品之间的关联规则制定销售策略。2 目标构建零售商品的Apriori关联规则模型,分析商品之间的

2021-01-13 21:51:13 18578 14

原创 电商用户画像分析

1 分析背景京东电商平台最近小家电类目的订单数量、产品浏览量、搜索数量等都有所下降, 现在部门计划对小家电类目进行一次季末促销活动,希望你能针对小家电的用户特征给出一些建议2 分析目的通过京东用户信息数据、用户订单数据对用户进行用户画像分析,给出促销活动建议3 数据理解1)数据来源京东平台用户信息和订单信息(2020年8月13日-8月19日)2) 数据字段说明①用户信息表共有39个字段,共计325,816条记录。其字段名称对照关系如下:②用户订单表共有24个字段,共计9,640,11

2021-01-13 15:27:02 7752 29

原创 SQLyog上传excel&csv文件

①创建mydata数据库,创建表userbehavior# 创建数据库CREATE DATABASE IF NOT EXISTS mydata CHARSET utf8;USE mydata;# 创建表userbehaviorCREATE TABLE userbehavior ( user_id INT (10), item_id INT (10), category_id INT (10), behavior_type VARCHAR (10), timestamps VAR

2021-01-08 20:15:49 282

原创 使用SQL挖掘电商⽤户⾏为数据

1 分析流程和方法1.1 数据类型分析当没有清晰的数据看板时我们需要先清洗杂乱的数据,基于分析模型做可视化,搭建描述性的数据看板。基于描述性的数据挖掘问题,提出假设做优化,或者基于⽤户特征数据进⾏预测分析找规律,基于规律设计策略。1.2 数据分析的两个典型场景在数据分析中有两个典型的场景:⼀种是有数据,没有问题:需要先整体分析数据,然后再根据初步的描述分析,挖掘问题做诊断性分析,提出假设,设计策略解决问题。另⼀种是已经发现了问题,或者已经有了假设,这种做数据分析更偏向于验证假设。2 淘

2021-01-08 17:49:42 555

原创 商品销售额持续下滑可视化分析

1 项目背景A集团去年在B大区新开了一家A商场。 最近,B大区经理发现从今年7月开始, 该商场的销售额一直呈下降趋势,于是让区公司的数据分析师配合商场的王经理去排查下降原因,解决这一问题。2 问题排查1)第一步,查看数据口径,核对数据准确性,确认问题。2)第二步,了解下降发生前后的业务情况。3)第三步,人货场框架拆解。4)第四步,下降点确定–会员销售额和复购下降。2.1 问题出现在老顾客身上开始上升的原因:商场从今年4 月开始每周六都会进行大促活动。大促重点:满减和新会员抽奖活动宣

2021-01-05 01:59:14 1263

原创 Matplotlib详解

1.简单的折线图对于图表来说,最简单的莫过于作出一个单一函数的图像。# 导入相关的包import numpy as np# 关闭警告import warningswarnings.filterwarnings('ignore') %matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snssns.set_style('whitegrid') plt.rcParams["font

2021-01-04 21:33:20 1197 1

原创 电商案例分析

1.项目背景随着电商的不断发展,网上购物越来越流行,更多电商平台崛起。对于电商卖家来说增加的不止是人们愈来愈高的需求,还要面对更强大的竞争对手。面对这些挑战时,就需要能够及时发现店铺经营中的问题,并且能够有效解决这些实际问题,从而提升自身的竞争力。根据已有数据对店铺整体运营情况分析,了解运营状况,以及对未来进行预测,已经成为一个电商以及运营等岗位必不可少的技能。本项目将对一家全球超市4年(2011-2014)的零售数据进行数据分析。2.分析目标分析每年销售额增长率各个地区分店的销售额销售淡旺

2021-01-04 19:01:31 2480 1

原创 用户流失预测分析

1.项目背景客户流失是所有与消费者挂钩行业都会关注的点。因为发展一个新客户是需要一定成本的,一旦客户流失,除了浪费拉新成本,还需要花费更多的用户召回成本。所以,电信行业在竞争日益激烈当下,如何挽留更多用户成为一项关键业务指标。为了更好运营用户,这就要求要了解流失用户的特征,分析流失原因,预测用户流失,确定挽留目标用户并制定有效方案。2.明确分析问题分析用户特征与流失的关系。从整体情况看,流失用户普遍具有哪些特征?尝试找到合适的模型预测流失用户。针对性给出增加用户黏性、预防流失的建议。3.

2021-01-03 16:51:08 6207 2

原创 Matplotlib绘图中文乱码

在导包输入plt.rcParams[“font.sans-serif”] = [“SimHei”] 后,切记不能在后面绘图时输入sns.set(style=“whitegrid”),否则会覆盖掉plt.rcParams[“font.sans-serif”] = [“SimHei”]设置。推荐的导包顺序#导入数据分析需要的包import pandas as pdimport numpy as np#可视化包import seaborn as snssns.set(style="whitegrid

2020-12-24 14:56:11 137

原创 出现ModuleNotFoundError: No module named ‘sklearn.impute‘的问题

在jupyter notebook上输入from sklearn.impute import SimpleImputer,出现ModuleNotFoundError: No module named ‘sklearn.impute’原因:可能是因为自己的 scikit-learn 库版本太低,需要将其更新到 0.20 版本或以上pip list查看库更新包:pip install --upgrade scikit-learn==0.22.0 -i https://pypi.tuna.tsingh

2020-12-23 00:45:05 2821

原创 matplotlib绘图

matplotlib绘图通过plt.xxx()直接绘图plt中用于绘图的部分函数函数名作用plt.bar()条形图plt.barh()横排条形图plt.boxplot()箱线图plt.hist()频率直方图plt.plot()折线图plt中用于设置的部分函数函数名作用plt.title()设置图表标题plt.grid()设置图表网格plt.xlable()设置x轴标题plt.ylable(

2020-12-18 21:17:43 197 1

原创 MySQL-窗口函数-排序

这两天刷了一遍45道mysql面试题,其中排序问题,用5.7版本的方法解决有些复杂,而mysql 8.0之后的版本可以用窗口函数解决,相对容易些。注:查看mysql版本select version();查询结果:01-什么是窗口函数窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库数据进行实时分析处理。窗口函数的基本语法:<窗口函数> over (partition by <用于分组的列名>

2020-11-18 00:12:47 3710

原创 mysql报错

[Err] 1055 - Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated colum今天反复遇到这个报错,记录一下。在mysql中使用 group by 出现的问题ERROR 1055 (42000): Expression #3 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘ynn

2020-11-16 21:26:05 85

原创 Markdown语法+typora

Markdown语法学习01-多级标题Markdown支持6个级别的标题大小在标题前,加几个"#"号就代表几级标题,写法如下:# 三级标题## 四级标题###### 六级标题效果:三级标题四级标题六级标题快捷键:Ctrl + (1-6):一级~六级标题Ctrl + 0:普通文本02-字体粗体、斜体、下划线、删除线 写法如下:这里是加粗这里是斜体这里是加粗斜体这里是下划线这里是删除线效果如下:Hello world! (加粗:Ctrl+B)Hello wo

2020-09-23 13:19:39 217

原创 魔法方法-阿里云天池

1.基本的魔法方法1.1 init(self[, …]) 构造器,当一个实例被创建的时候调用的初始化方法【例子】1.2 new(cls[, …]) 在一个对象实例化的时候所调用的第一个方法,在调用__init__初始化前,先调用__new__。new__至少要有一个参数cls,代表要实例化的类,此参数在实例化时由 Python 解释器自动提供,后面的参数直接传递给__init。new__对当前类进行了实例化,并将实例返回,传给__init__的self。但是,执行了__new,并不一定会进入__

2020-09-14 22:46:51 144

原创 类与对象-阿里云天池

【类】是一个函数包。类中可以放置函数和变量,然后类中的函数可以很方便的使用类中的变量。语法:创建一个名为“ClassName”的类如定义一个名为’电影’的类,可以写成class Movie():既然【类】是一个函数包,所以一个类中可以放置一堆函数类中的函数叫方法,调用格式:类.函数()类中的变量叫属性,调用格式:类.变量class Robot(): bust = 33 waist = 44 hip = 55 IQ = 200 # 以上为类的属性

2020-09-13 23:40:36 84

原创 函数--阿里云天池

函数是什么与数学中的函数不同,在Python中,函数不是看上去冰冷无聊的规则和公式,而是有实打实的、有自己作用的代码。比如说当我们需要实现“打印”这个功能,我们会用到print();当我们需要实现“获取数据长度”这个功能,我们会要到len()。这些都是设定好了,可以直接拿过来就用的功能,这就叫做“组织好的代码”。函数的定义定义和调用函数定义函数的语法:调用函数函数参数类型主要的参数类型有:位置参数、默认参数、不定长参数【位置参数】def menu(appetizer,cou

2020-09-12 23:56:02 145

原创 字典--阿里云天池

字典1.字典的定义字典 是无序的 键:值(key:value)对集合,键必须是互不相同的(在同一个字典之内)字典1.有名称;2.要用=赋值;3.用逗号作为元素间的分隔符;4.外层是大括号{ };5.字典的元素是由一个个键值对构成的,用英文冒号连接。如’小明’:95,其中我们把’小明’叫键(key),95叫值(value)。2.从字典中提取元素我们将小明的成绩从字典里打印出来。这就涉及到字典的索引,和列表通过偏移量来索引不同,字典靠的是键。3.给字典增加/删除元素3.1 删除字典里键值对的代

2020-09-11 23:26:03 210

原创 字符串--阿里云天池

字符串1.定义Python 中字符串被定义为引号之间的字符集合。Python 支持使用成对的 单引号 或 双引号。1.2 Python 的常用转义字符【例子】如果字符串中需要出现单引号或双引号,可以使用转义符号\对字符串中的符号进行转义【例子】原始字符串只需要在字符串前边加一个英文字母 r 即可。【例子】三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。2.字符串的切片与拼接类似于元组具有不可修改性从 0 开始 (和 Java 一样)切片通常写成 s

2020-09-10 23:48:40 127

原创 python基础入门:列表--阿里云天池

1定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为 [元素1, 元素2, …, 元素n]。关键点是「中括号 []」和「逗号 ,」中括号 把所有元素绑在一起逗号 将每个元素一一分开2列表的创建2.1创建一个普通列表2.2利用range()创建列表2.3利用推导式创建列表2.4创建一个混合列表2.5创建一个空列表3向列表中添加元素3.1 list.append(obj) 在列表末尾添加新的对象,只接受一个参数,参数可以是任何数据类型,被追

2020-09-09 22:53:07 173

原创 python基础入门:数据类型--阿里云天池

在Python的魔法世界,最常用的数据类型有三种——字符串(str)、整数(int)和浮点数(float),他们三者分别具有不同的属性:字符串字符串英文string,简写str,此数据类型组团必备随处可见,皮糙肉厚战斗力爆表。作为最常用的数据类型,字符串的识别方式非常简单——有层名为【引号】的皮。只要是被【单/双/三引号】这层皮括起来的内容,不论内容是中文、英文、数字甚至火星文。只要是被括起来的,就表示是字符串类型。关于字符串,一定要记得:字符串类型必须有引号的辅助。整数整数英文为intege

2020-09-08 23:53:06 130

原创 python基础入门:循环语句--阿里云天池

for…in…循环语句例如:列表结果:字典:结果:这个过程,在Python中的学名就叫做【遍历】。tips:字典、列表和字符串可以放在for循环语句里,而整数、浮点数如果把它们放在for循环里,代码会报错。range()函数除了列表,字典,字符串三种数据类型,我们还可以遍历其他的数据集合。比如和for循环常常一起搭配使用的:range() 函数。1.使用range(x)函数,就可以生成一个从0到x-1的整数序列输出结果:2.使用range(a,b) 函数,可以生成了一

2020-09-07 23:50:42 141

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除