Tableau数据分析笔记-Chapter14线性回归、时间序列分析

Tableau数据分析-Chapter14线性回归、时间序列分析

  1. 回归分析

    • 线性回归模型及参数解释
    • 构建其他回归分析模型
  2. 时间序列分析

    • 创建人工服务接听量预测曲线
    • 预测选项设置
    • 预测模型评价

回归分析

线性回归模型及参数解释

回归分析是将可能存在相关关系的变量拟合成直线或者曲线,然后据此一方面总结已有数据的规律和特征,另一方面预测数据。

导入数据“人工坐席接听数据.xlsx”

在工作表1,将【人工服务接听量】放入【列】,将【呼入案头总时长(秒)】放入【行】。

点击【分析】,取消【聚合度量】的勾选。

在这里插入图片描述

第一种添加趋势线方式

选择【整个视图】,右击图表——【趋势线】——【显示趋势线】。这样就添加好了线性回归模型。

在这里插入图片描述

将鼠标悬浮在趋势线上,会出现提示框。

image-20211022095656909

参数解释

线性回归就是一次方程,比如y=nx+b

R值就是拟合优度,越大越好,R平方值范围是0-1,一般认为0.1上都可以,越大越好。

R值越大越好,越大越拟合越有关联性,P值越小越好,P值决定了可信程度

P值越小越好,常规设置是<0.05,可以调整。P值决定了系数,比如提示框里15.9995的核心程度。

第二种添加趋势线方式

【分析】——【趋势线】——【显示趋势线】。

image-20211022095952884

第三种添加趋势线方式

选择【分析】下【模型】里的【趋势线】,拖到右边图表里,会自动显示趋势线选择框,拖到【线性】里。

image-20211022100209418

描述趋势线

右击趋势线——【描述趋势线】,可见公式和系数。

image-20211022100424209

选择里面的公式,右击复制,然后关闭,右击图表空白处——【添加注释】——【区域】,复制公式到里面,选择字号大小,点击【确定】,将注释长宽调整到合适位置。

image-20211022101220239

其他的回归分析模型

  • 对数回归
  • 幂回归
  • 指数回归
  • 多项式回归

对于其他的回归分析模型,我们只需编辑趋势线即可

image-20211022101453218

image-20211022101406505

对数模型

重命名工作表1为“线性回归”,复制该工作表,重命名为“对数回归”

右击图表里的趋势线——【编辑趋势线】。

image-20211022101613629

鼠标悬浮在趋势线上,可见公式,里面的人工服务接听量属于解释变量。

R平方值小于上面的线性,说明不如线性的好。

指数回归

复制工作表【对数回归】,重命名为【指数回归】。

点击趋势线,点击【编辑】,勾选【指数】。

image-20211022102034309

R平方值大于上面的对数,说明比对数的好。

为什么这里的指数回归的R平方值比对数回归的要好?

因为指数回归线下部的数据占比非常少,对拟合结果的影响非常非常小。

image-20211022102317085

比如以人工服务接听量等于120为界限,大于120的为异常数据,创建一个计算字段计算异常数据的占比是多少。

计算字段比较

右击【人工服务接听量】——【创建】——【计算字段】

修改字段名称为【人工服务接听量异常区分】,输入公式IF [人工服务接听量]>120 THEN "异常数据" ELSE "正常数据" END

image-20211022102454897

新建工作表

将【人工服务接听量异常区分】拖到【列】,将【记录数】拖到【行】。

将【记录数】拖到【标签】,右击【总和(记录数)】——【快速表计算】——【合计百分比】。

img

可见大于120的异常值只占了3.58%,非常少的比例,对拟合优度影响不大。

一般数据分析中,小于6%的数据可以忽略不计。

参数比较

在【指数回归】工作表里,空白处右击——【创建参数】,设置一个参数调整异常数的界定。

image-20211022104045373

右击【人工服务接听量异常区分】——【编辑】,去除数字120,将【人工服务接听量异常定义阈值】拖入到公式里,点击【确定】。

IF [人工服务接听量]>[人工服务接听量异常定义阈值] THEN "异常数据" ELSE "正常数据" END

在这里插入图片描述

右击【人工服务接听量异常定义阈值】——【显示参数控件】,则右边显示参数控件。

image-20211022104227129

参考线比较

回到指数回归表格

【人工服务接听量异常区分】拖到【详细信息】,右击坐标轴空白处——【添加参考线】,【值】选择【人工服务接听量异常定义阈值(参数)】点击确定。

image-20211022105046799

image-20211022105349790

幂回归

复制【指数回归】工作表,重命名为【幂回归】。

右击趋势线——【编辑趋势线】,选择【幂】,点击【确定】。

鼠标悬浮在趋势线上,可见公式。

R平方值大于以上回归,说明该拟合优度比较好。

P值较小,可以接受。

image-20211022105949269

多项式回归

复制【幂回归】工作表,重命名为【多项式回归】。

右击趋势线——【编辑趋势线】,选择【多项式】,【度】的范围是2-8,一般选择3-5,这里选3,点击【确定】。

鼠标悬浮在趋势线上,可见公式。

R平方值一般,说明该拟合优度一般。

P值较小,可以接受。

image-20211022141513396

如何评定一个回归分析模型的好坏?

R平方值就是拟合优度,越大越好(在0到1之间),一般0.4或0.5以上是可以接受的。

P值就是显著性水平,一般设置小于5%,也就是0.05。

时间序列分析

时间序列分析预测是对Tableau内嵌周期性数据的一个预测功能。能够自动拟合预测模型,分析数据的变化规律和预测数据,能够对预测模型的参数进行调整,然后评价预测模型的精度。

将【人工服务接听量】拖到【行】,将【日期】拖到【列】——日期改为【天】。

image-20211022142108684

image-20211022141743885

重命名工作表为【时间序列分析】。

时间序列分析或时间预测本质上是利用原始的时间数据,来拟合出一个模型,研究数据的发展变化的规律,从而得出观测数据的统一特征。找到这个特征,再依据拟合出的模型,外推一个时间段内的数值。

时间序列分析能够识别以周为周期还是以月为周期的匹配情况。

图表的空白处右击——【预测】——【显示预测】,默认情况下是一条直线,是因为没有进行参数设置。
image-20211022142203827

预测选项设置

图表的空白处右击——【预测】——【预测选项】。

【精确】选择【天】,【直至】选择【9】【天】,【季节】选择【累加】,点击【确定】。

【精确】可以按照天、周、月、季度、年等预测。

【直至】是预测的结束范围。

谨慎注意【用零填充缺少值】,如果缺少值是关键时间点的数值的话,会影响模型,一般会回到原始数据中填写。

【趋势】只有不变、增加或减少三种趋势,没有先增后减,或先减后增等情形。

【季节】就是周期的意思。

【显示预测区间】跟P值有关系,计算方法是1-P=预测区间。
image-20211022142450323

图表的空白处右击——【预测】——【描述预测】。

为什么【忽略最后】要忽略最后一天?是因为最后一天对预测的影响太大,一般会忽略。

image-20211022142539680

【显示预测区间】是【95%】时,这里的值是7473。如果【显示预测区间】为【99%】,则值为9821。

image-20211022142702334

image-20211022142736406

恢复【显示预测区间】为【95%】。

质量有三种:差、确定 、好。

将【预测选项】里的【季节】改为【累乘】,在【描述预测】里【质量】显示【确定】。

image-20211022142829104

将【预测选项】里的【趋势】和【季节】都改为【累加】,在【描述预测】里【质量】为【差】。

image-20211022142933048

如果将【预测选项】里的【趋势】和【季节】都改为【无】,则预测为直线,说明【趋势】和【季节】都没有做贡献。

累加和累乘的区别

如果数值数量级差异比较大的话,用累乘比较合适。

将【预测选项】里的【趋势】改为【无】,【季节】都改为【累加】,打开【描述预测】,可见【模型】。

image-20211022143108000

预测模型评价

【描述预测】里有【质量】。

质量有三种:差、确定 、好。

作业:

使用超市数据,分析销售额随月份变化的情况,添加线性回归模型,并将模型公式以添加区域注释的方式添加到图形空白区域,

再通过时间序列分析,通过每月的销售额预测13个月的销售额数据,(提示:预测模型选择:累加+累加),

将模型预测评价作为参数添加到说明中,导出图像。

image-20211022144102192

片转存中…(img-LQdXHYHD-1635064500766)]

预测模型评价

【描述预测】里有【质量】。

质量有三种:差、确定 、好。

作业:

使用超市数据,分析销售额随月份变化的情况,添加线性回归模型,并将模型公式以添加区域注释的方式添加到图形空白区域,

再通过时间序列分析,通过每月的销售额预测13个月的销售额数据,(提示:预测模型选择:累加+累加),

将模型预测评价作为参数添加到说明中,导出图像。

[外链图片转存中…(img-H40mrqrn-1635064500770)]

image-20211022144120362

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值