置信度=在事务中已经包含X的情况下包含Y的百分比;
支持度=事务中同时包含X、Y的百分比;
下面看一个三级数据库题库的真题吧
1)以下是某商场的购物记录集合,每个购物篮中包含若干商品。现在要基于该数据集进行关联规则挖掘,如果设置最小支持度为60%,
最小置信度为80%,则在以下列出的关联规则中,符合条件的是()。
由表中可以看出,
事务中同时包含C,D的支持度为3/5=60%;
在包含D的情况下包含C的置信度为3/3=100%;
所以这个题也就不难看出答案啦,选D;
·对于置信度一般我们会说'……实验结果落在某个置信区间的可能性可以达到多高……'(这个可能性越大置信度就越高)
· 而对于显著性我们会说'……我们的理论假设被否定的可能性小于多少,我们的假设就可以被称为显著或者极显著……'(这个可能性越小显著性越高)
也就是说,置信度通常是正面描述(拒伪的),而且通常需要与一个置信区间关联起来。而显著性则是反面描述(拒真的),而且通常需要与一个预设的判断门槛值联系起来。
参数显著的,就是说该参数估计量的统计性质可以拒绝原假设:该参数=0,即该参数显著不等于0,也就是该参数前面的变量对y确实有影响,出现在回归方程里面是有道理的。
参数的显著性,是实证模型有意义的关键所在。