数据集来源:
Telco Customer Churn | KaggleFocused customer retention programshttps://www.kaggle.com/datasets/blastchar/telco-customer-churn下载得到一个excel文件WA_Fn-UseC_-Telco-Customer-Churn.csv,打开excel看一下
有21列,7000+行,这个数据量不大,用sql可以做
熟悉一下表格内容,看一下每列的数据类型,有没有明显异常的列,比如很多的0,或者有负数或者格子为空没有数据的情况。
(我粗粗拉了下表,没感到有明显异常的列)
这个案例用到的sql语句和tableau操作都是最基础的
首先是SQL部分,对数据进行一个简单的处理:
首先是建库建表:
#创建数据库
DROP DATABASE IF EXISTS Telco_Customer_Churn;
CREATE DATABASE Telco_Customer_Churn;
USE Telco_Customer_Churn;
#建表
DROP TABLE IF EXISTS customer_details;
CREATE TABLE customer_details(
customerID VARCHAR(30) ,
gender VARCHAR(30),
SeniorCitizen VARCHAR(30) ,
Partner VARCHAR(30) ,
Dependents VARCHAR(30) ,
tenure INT,
PhoneService VARCHAR(30),
MultipleLines VARCHAR(30),
InternetService VARCHAR(50),
OnlineSecurity VARCHAR(50),
OnlineBackup VARCHAR(50),
DeviceProtection VARCHAR(50),
TechSupport VARCHAR(50),
StreamingTV VARCHAR(50),
StreamingMovies VARCHAR(50),
Contract VARCHAR(50),
PaperlessBilling VARCHAR(30),
PaymentMethod VARCHAR(50),
MonthlyCharges FLOAT,