熵权法与Apriori算法对较多数据种类数据的处理

御代

已于 2022-04-28 22:26:44 修改

阅读量1k

点赞数 2

分类专栏：大数据概论文章标签：算法

于 2022-04-28 22:23:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51551835/article/details/124481027

版权

本文介绍了熵权法和Apriori算法的基础知识，包括熵的概念、熵权法在TOPSIS模型中的应用以及Apriori算法的项集、支持度和置信度。文章探讨了如何将这两种方法结合，以处理大量数据种类的问题，提出通过Apriori算法预筛选特征，减少熵权法的计算量。

摘要由CSDN通过智能技术生成

前言：前两天女朋友问我他们论文的时候看到他们用了基于熵权的TOPSIS模型做分析，由于本人没学过有关统计方面的知识，所以就去现学了一下。好巧不巧，在学校上课的时候老师提到了Apriori算法，突然联想到感觉可以结合一下

基础知识

1熵权法：

1.1什么是熵？

熵是一个物理学概念，可以通俗的理解为表示一个物体稳不稳定的物理量，越稳定，熵值越小；反之，越不稳定，熵值越大。在统计学领域中，当数据越分散时，熵值越小，可认为该数据包含信息越多，因此权重越大，这也是熵权法的解释。
举个例子：比如说，太阳东升西落。这是一个客观规律，基本上不会有什么变动，而我们从这句话得到的信息也很固定，不分散，所以是一个熵值大的信息

1.2熵权法

熵权法是一种客观赋权方法，在具体使用过程中，根据各指标的数据的分散程度，利用信息熵计算出各指标的熵权，再根据各指标对熵权进行一定的修正，从而得到较为客观的指标权重。

翻译一下：
就是当一个事物有很多项指标可以描述它，他是每一项指标只能描述一部分。这个时候就可以通过熵权法来计算每一个指标占的比重是多少

举个简单例子：
体测：我们可以从身高体重、肺活量、立定跳远、引体向上、仰卧起坐、800/1000米来评判一个人健不健康（其实就是体测成绩每一项也都有比重），不能说一个人立定跳远能跳两米五，就能证明他身体好

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
熵权法与Apriori算法对较多数据种类数据的处理

#**前言：**前两天女朋友问我他们论文的时候看到他们用了基于熵权的TOPSIS模型做分析，由于本人没学过有关统计方面的知识，所以就去现学了一下。好巧不巧，在学校上课的时候老师提到了Apriori算法，突然联想到感觉可以结合一下基础知识1熵权法：1.1什么是熵？熵是一个物理学概念，可以通俗的理解为表示一个物体稳不稳定的物理量，越稳定，熵值越小；反之，越不稳定，熵值越大。在统计学领域中，当数据越分散时，熵值越小，可认为该数据包含信息越多，因此权重越大，这也是熵权法的解释。举个例子：比如说，太阳东升西
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。