1电商平台零售数据分析

本文介绍了使用Python进行电商平台零售数据的分析过程,环境为Anaconda3和Python3.8,借助Jupyter Notebook完成。数据文件存储在百度网盘,提供链接及提取码供读者下载。适合Python初学者,特别是对数据分析和机器学习感兴趣的人,更新频率为每周六。
摘要由CSDN通过智能技术生成

1电商平台零售数据分析

环境为Anaconda3,Python3.8,用JupyterNotebook写的
数据文件在百度网盘
链接:https://pan.baidu.com/s/1DwWF4Vpduj8SqRUUezt4ew
提取码:2222

import plotly as py
py.offline.init_notebook_mode()
pyplot = py.offline.iplot

import plotly.graph_objs as go
from plotly.graph_objs import Scatter

from scipy import stats

import pandas as pd

import numpy as np

import seaborn as sns


import matplotlib.pyplot as plt

import os
os.chdir(r'E:\2020年Python数据分析师特训营全套84节视频完结版(就业向零基础友好)\2020年Python数据分析师特训营全套84节视频完结版') 
df = pd.read_excel('超市数据.xlsx', dtype= {
   'Row ID':str})
df


#缺失率
df.apply(lambda x:sum(x.isnull())/len(x),axis=0)


#拷贝原文件为df1,防止数据丢失
df1 = df.copy()
df1

#去掉有缺失值的数据
df1.dropna(how='any')


# #去掉指定的两列
# df1.drop(['Unnamed: 24','Unnamed: 25'],axis=1,inplace=True)


#将Shipping Cost这一列中的缺失值替换为U
df['Shipping Cost'] = df['Shipping Cost'].fillna('U')


#先导入re模块,可以使用split一次加入多个切割条件
import re
#取出Ship Date这一列的每行字符串中以/分隔开的第一、二、三个元素
df1['ship_day'] = [re.split('\/|\-',x)[0] for x in df1['Ship Date']]
df1['ship_month'] = [re.split('\/|\-',x)[1] for x in df1['Ship Date']]
df1['ship_year'] = [re.split('\/|\-',x)[2] for x in df1['Ship Date']]


#将Order Date转换为datetime格式
df1['Order Date'] = pd.to_datetime(df1['Order Date'],errors='coerce')
df1['Order Date'] = df1['Order Date'].dt.date


#去重
df1 = df1.drop_duplicates()


#查看数据类型
df1.info()


#异常值处理之前先探索数据
df1.describe()

#将Sales Quantity Profit转换为float64
df1['Sales'] = pd.to_numeric(df1['Sales'], errors='coerce')
df1['Quantity'] = pd.to_numeric(df1['Quantity'], errors='coerce')
df1['Profit'] = pd.to_numeric(df1['Profit'], errors='coerce')

#计算Sales*Quantity保存为新的一列Price
df1['Price'] = df1.apply(lambda x:x['Sales']*x['Quantity'],axis
  • 10
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值