用户存续期价值评估CLV(四)--python 实现

Python for NB/BGD

    在本系列的第四部分,我们将使用Python来实现这个模型。输入数据采用开放数据集Online Retail Dataset

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

数据清洗

data = pd.read_excel('Online Retail.xlsx')
data.info()

<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 541909 entries, 0 to 541908
Data columns (total 8 columns):
InvoiceNo 541909 non-null object
StockCode 541909 non-null object
Description 540455 non-null object
Quantity 541909 non-null int64
InvoiceDate 541909 non-null datetime64[ns]
UnitPrice 541909 non-null float64
CustomerID 406829 non-null float64
Country 541909 non-null object
dtypes: datetime64ns, float64(2), int64(1), object(4)
memory usage: 33.1+ MB

data.InvoiceDate.min()

Timestamp(‘2010-12-01 08:26:00’)

last_day = data.InvoiceDate.max()
last_day

Timestamp(‘2011-12-09 12:50:00’)

data.dropna(inplace=True)
data[["CustomerID"]] = data[["CustomerID"]].apply(pd.to_numeric)

data.set_index('CustomerID',
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值