顾客使用天猫优惠券预测分析

背景:

“天猫”(英文:Tmail,亦称淘宝商城、天猫商城)原名淘宝商城,是一个综合性购物网站,是马云淘宝全新大招的B2C(Business-to-Consumer,商业零售)品牌,其整合数钱家品牌商、生产商,为商家和消费者之间提供一站式解决方案,提供100%品质保证的商品,7天无理由退货的售后服务,以及购物积分返现等优质服务

对顾客是否使用优惠券进行预测
在这里插入图片描述

一、数据概况分析

import pandas as pd
import numpy as np
import seaborn as sns
%matplotlib inline
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']='SimHei'
plt.rcParams['axes.unicode_minus']=False
coupon = pd.read_csv('天猫优惠券.csv')

#查看数据
coupon.head()

在这里插入图片描述

coupon.tail()

在这里插入图片描述

coupon.info()

在这里插入图片描述

coupon.job.value_counts()

在这里插入图片描述

coupon.marital.value_counts()

在这里插入图片描述

#需要把类别变量转化为数字型变量
coupon = pd.get_dummies(coupon)
coupon.head()

在这里插入图片描述

#删除包含重复无意义信息
coupon.drop(['job_unknown','default_no','returned_no','loan_no'],axis=1,inplace=True)
coupon=coupon.rename(columns={'coupon_ind':'flag'})
coupon.head()

在这里插入图片描述

二、关键变量的选择

#二分类模型,分析flag 1和0的占比
#观察样本0,1的平衡性
coupon.flag.value_counts()

在这里插入图片描述

coupon.flag.value_counts(1)

在这里插入图片描述

summary = coupon.groupby('flag')
summary

在这里插入图片描述

summary.mean()

在这里插入图片描述

#以returned_yes观察在flag上的分布
sns.countplot(y='returned_yes',hue='flag',data=coupon)

在这里插入图片描述

coupon.corr()[['flag']].sort_values('flag',ascending=False)

在这里插入图片描述
coupon_used_in_last_month和job_retired相关性比较高

三、建立模型

y=coupon['flag']
x=coupon[['coupon_used_in_last_month','job_retired','job_student']]

#调用sklearn模块,随机抽取训练集与测试集

from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3,random_state=100)

调用skearn中逻辑回归模块

from sklearn.linear_model import LogisticRegression
Lr = LogisticRegression()
#模型拟合
Lr.fit(x_train,y_train)

在这里插入图片描述

#查看截距
Lr.intercept_

在这里插入图片描述

#查看斜率
Lr.coef_

在这里插入图片描述

#预测
y_pred_train=Lr.predict(x_train)
y_pred_test=Lr.predict(x_test)
#评估模型
import  sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)

在这里插入图片描述

metrics.accuracy_score(y_train,y_pred_train)

在这里插入图片描述

#使用AUC评估模型
from sklearn.metrics import roc_curve,auc
fpr,tpr,threshold = roc_curve(y_train,y_pred_train)
roc_auc = auc(fpr,tpr)
roc_auc 

在这里插入图片描述

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值