数据分析
ChangingWudake
优秀不够,你是否无可替代。
展开
-
vapord可视化、
1.总体情况2.月销售额3.日销售情况4.上三图的仪表板5.当天的销售额6.当天产品分类的销售情况7. 品牌销量前108. 销售额前10的产品9. 基于上面四张图的仪表板10. 评分、客户评论分群11. 库存情况12. 工作日的销售情况13. 品牌销售额帕累托14. 品牌销量帕累托...原创 2020-12-14 16:37:32 · 183 阅读 · 0 评论 -
vapordn数据可视化
1、分析2.分析思路3.可视化3.1 总体情况9月21到今天的销售情况3.2 月的销售情况3.3 每日销售情况3.4 上三张图的仪表板3.5 今天的销售情况3.6 产品分类的销售情况3.7 brand销售量、销售额top103.8 产品销售额、销售量top103.9 基于上面四张图表做成的仪表板实现每天更新、或者定位到某天的详细数据3.10 产品评分、客户评论分群3.11 每天的库存总量3.12 库存原创 2020-11-25 17:26:15 · 223 阅读 · 0 评论 -
传统线下连锁店数据分析Python结合Tableau
1 分析背景:这是kaggle上的一份关于巴西商店的实际销售数据,大小约3.43G,包含了从2017年3月31日到2020年4月1日大约2600万多的销售数据。分析该数据集可以探究该商店的销售情况,产品的分布,可以对客户进行细分,精细化销售,对员工的生产力进行分析。这里是利用Python结合Tableau来进行分析,可视化用的Tableau,部分分析用的Python。数据解读:2 分析框架3 数据清洗3.1 读取数据,看看总体情况这里的数据集比较大,Anaconda加载的数据都暂时存在内存里,原创 2020-06-10 14:15:41 · 1118 阅读 · 2 评论 -
Python算法预测实战
1.分析背景这是一份kaggle上的银行的数据集,研究该数据集可以预测客户是否认购定期存款y。这里包含20个特征。2. 分析框架3. 数据读取,数据清洗# 导入相关包import numpy as npimport pandas as pd # 读取数据data = pd.read_csv('./1bank-additional-full.csv')# 查看表的行列数data.shape输出:这里只有nr.employed这列有丢失数据,查看下:data['nr.employ原创 2020-05-22 16:09:36 · 4515 阅读 · 5 评论 -
Python四种分类器模型的实现
1.导入相关包# 导入相关包import numpy as npimport pandas as pd# 导入数据集from sklearn.datasets import load_iris# 导入模型from sklearn.tree import DecisionTreeClassifier# 数据分割包from sklearn.model_selection import train_test_split# 评价包from sklearn.metrics import mean原创 2020-05-19 11:33:25 · 6915 阅读 · 0 评论 -
CART决策树实战
1. 导入相关包# 导入相关包import numpy as npimport pandas as pd# 导入数据集from sklearn.datasets import load_boston# 导入模型from sklearn.tree import DecisionTreeRegressor# 数据分割包from sklearn.model_selection import train_test_split# 评价包from sklearn.metrics import me原创 2020-05-19 09:48:46 · 235 阅读 · 0 评论 -
时间序列ARMA和ARIMA
1.简介1.1 时间序列包括:AR(自回归模型),AR§,p阶的自回归模型,这里表示的是以前面p个值加上当前的干扰项形成的线性模型来预测当前值的一个模型。MA(移动平均模型),MA(q),q阶的移动平均模型,表示是以前面的q个干扰项+ARMA(自回归移动平均模型)ARIMA(差分自回归移动平均模型)1.2 运用对象这里四种模型都是针对于变量y,针对时间变化而发生的改变,这四种模型的运用对象都是平稳的时间序列。也就是随着时间的变化,在一定范围内动态波动。不平稳序列如下图所示:平稳序列如下图原创 2020-05-17 17:18:31 · 8685 阅读 · 0 评论 -
Python实现LRFM模型分析客户价值
1. 分析背景这是一份某电商平台的销售数据,数据包含2010年4月22到2014年7月24的销售数据。分析该销售数据,可以发现客户价值。现利用KMeans聚类实现LRFM模型来分析客户的价值,便于客户分群,针对性推广,提高销售额。LRFM模型定义:L:会员创建日期距离距离2014年7月25的时间间隔(单位:月 )R:会员最近一次购买时间距离2014年7月25的时间间隔(单位:月 )F:会员购买次数M:会员的总购买金额2. 分析流程3. 数据探索3.1 导入相关包和读取数据import原创 2020-05-14 16:03:36 · 1575 阅读 · 0 评论 -
Python实现ARMA模型
1.导入相关包,查看数据情况import numpy as np import pandas as pd import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei'%matplotlib inlinedf = pd.read_csv('./RFM分析1.csv')df.info()输出:...原创 2020-05-08 15:44:39 · 22117 阅读 · 12 评论 -
电商交易数据分析-Python
1.这是一份关于某电脑平台2016年的交易数据,通过分析这份数据,我们可以知道这一整年的销售情况。数据解读:id:IDorder_id:订单IDuser_id:用户IDproductId:产品IDcityId:城市的IDprice:价格payMoney:支付金额channelId:渠道IDdeviceType:设备类型createTime:创建时间payTime:支付时间...原创 2020-04-19 16:19:35 · 1558 阅读 · 2 评论 -
商城数据分析-Python
1.导入包# 导入包# 设置中文字体import pandas as pd import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei'2.读取数据# 读取excel的数据# 查看数据的情况(几行几列)df = pd.read_excel('商城分析_tableau.xlsx')df.sha...原创 2020-04-11 22:29:00 · 422 阅读 · 0 评论 -
商城数据分析—mysql实现
1.导入Excel的数据省略。2.查看表结构`select * from order_sc;`3.查询年销售额汇总select year1,round(sum(amount),0) as total_amountfrom orders_scgroup by year1;运行结果:4.月度销售额汇总select year1,month1,round(sum(amount...原创 2020-04-11 20:54:43 · 389 阅读 · 0 评论 -
商城数据分析Excel
1.获取数据:查看表数据的情况1.1查看数据,可以将订单创建日期的.进行替换,将数据转换成日期格式,这里选中订单日期这一列,按Ctrl+f,出现下图:如下图所示,输入,点击全部替换:新增年、月、日三列在年这列使用公式:=YEAR(C2)获取对应的年份,并选中年这列,右键->设置单元格的格式->数值->保留小数0,填充整列。填充:双击单元格右下角出现的+字架,整...原创 2020-04-11 12:18:33 · 787 阅读 · 0 评论