做一个让自己羡慕的优秀的人。
前段时间陆续收到了几个关注,还是挺有成就感的,看来要多学习,多产出了。坚持。
还是老规矩,先来一张Viz提高一下审美。
刚果共和国的冲突和食品安全
原文链接:https://public.tableau.com/zh-cn/gallery/conflict-and-food-security-drc?tab=viz-of-the-day&type=viz-of-the-day
今天是分析的最后一弹~我们来说一下趋势线和预测。
趋势线打开Tableau,选择示例-超市数据源。
有这样一个场景,比如你的老板寻找关于产品销售额和利润的关系,也就是说销售额对产品利润是否有影响?我们从这个场景来展开今天的学习。
拖动销售额到列功能区
拖动利润到行功能区
拖动产品名称到详细信息标记卡上
拖动类别到颜色标记卡上
散点图完成
切换到分析窗格,拖动趋势线,放入视图中,我们先选择线性。
这里我们不考虑产品类别对趋势的影响,只看总体情况,在其中一条线上右键,选择编辑所有趋势线
把类别去掉
这里我们可以看到关于趋势线的描述:
R平方值和P值代表什么呢?右键趋势线,点击描述趋势线模型。
可以看第一句话,P<=0.05时,说明该趋势线有意义。也就是说在本例中,该趋势线描述的销售额与利润的关系是有意义的。
我们通过R平方值的公式可以明显看出,当R平方值等于1的时候,说明模型完全拟合,本例中拟合程度并不高只有0.25+,所以销售额与利润并不一定是正相关关系。
关于详细解释,还是要去学习一下统计学的内容,后面我大概率会边学边讲的。
Tableau已经给你列出了你要关注的两个值,R平方值越接近1说明模型越准确,P值<0.05说明模型越有意义。
除了线性模型,我们还有其他的趋势线模型,你可以自行探索,这里我会列出几种模型的计算公式。
线性
对于线性模型类型,公式为:Y = b0 + b1 * X 其中,b1是斜率,b0是线的截距。 对数
对于对数模型类型,公式为:Y = b0 + b1 * ln(X) 由于不能对小于零的数字定义对数,因此在估算模型之前,解释性变量为负的任何标记将会 被筛选掉。避免使用会丢弃某些数据的模型,除非您知道筛选掉的数据是无效的。趋势线描 述报告在模型估算之前有多少标记被筛选掉。 指数
对于指数模型类型,公式为:Y = exp(b0)* exp(b1 * X) 对于指数模型,自然对数在估算模型之前对响应变量进行转换,因此,通过插入各种解释性 值来查找 ln(Y)的值,可找到视图中绘制的标记。ln(Y) = b0 + b1 * X 然后,将会取这些值的幂来绘制趋势线。您看到的是以下形式的指数模型:Y = b2*exp(b1 * X) 其中 b2是 exp(b0)的值。由于不能对小于零的数字定义对数,因此在估算模型之前,响 应变量为负的任何标记将会被筛选掉。 幂次
对于幂次模型类型,公式为:Y = b0 * X^b1 对于幂次模型,两个变量均由自然对数在估算模型之前转换,从而生成此公式:ln(Y) = ln(b0) + b1 * ln(X) 然后,将会取这些值的幂来绘制趋势线。
由于不能对小于零的数字定义对数,因此在估算模型之前,响应变量或解释性变量为负的 任何标记将会被筛选掉。 多项式
对于多项式模型类型,响应变量被转换为指定度数的多项式系列。公式为:Y = b0 + b1 * X + b2 * X^2 + … 对于多项式模型类型,您还必须选择介于 2和 8之间的“度”。较高的多项式度数会放大数据值之间的差异。如果您的数据增加得非常快,与高序项相比,低序项可能几乎没有变化, 从而使模型无法准确估算。另外,更复杂的高序多项式模型需要更多数据才能进行估算。检 查各个趋势线的模型描述,看看里面是否有指示无法使用此类型的准确模型的红色警告消息。
以上内容你当然可以在help文档中找到。
预测
预测功能虽然是Tableau的一大特色,但是由于实际工作中,业务比较复杂,影响预测的模型也很多,不止这一种单一模型,所以该功能用的很少。
创建预测的条件,当然是要有一个日期字段和你要分析的度量值。
Tableau中创建预测的模型使用的是指数平滑模型,关于该模型的细节我就不赘述了,你可以在help文档中找到。下面主要介绍一下如何创建预测。
先创建一个根据时间来统计销售额的趋势图吧。
切换到分析窗格,拖动预测到视图中。
预测创建好了,是不是很简单。当然背后的模型如果你深入研究的话很复杂。
我们还可以调整预测的时间范围,在预测趋势线上右键,选择预测中的预测选项按钮。
OK,你可以自己调整试试看~
到现在为止,分析功能我们就分享完了,课程已经进行了大半,我相信你已经入门了,下节开始我们会介绍Tableau最最最核心的两大功能,期待一下吧~