[数学理论]混淆矩阵

转载于http://wuguangbin1230.blog.163.com/blog/static/61529835201522905624494/

 混淆矩阵(Confusion Matrix):

       在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。

       在图像精度评价中,主要用于比较分类结果和地表真实信息,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个地表真实像元的位置和分类与分类图象中的相应位置和分类像比较计算的。混淆矩阵的每一列代表了地面参考验证信息,每一列中的数值等于地表真实像元在分类图象中对应于相应类别的数量;混淆矩阵的每一行代表了遥感数据的分类信息,每一行中的数值等于遥感分类像元在地表真实像元相应类别中的数量。

如有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵为: 


类1

类2

类3

类1 43 5 2
类2 2 45 3
类3 0 1 49

       每一行之和为50,表示50个样本,

       第一行说明类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3

关于混淆矩阵

混淆矩阵是用来反映某一个分类模型的分类结果的,其中行代表的是真实的类,列代表的是模型的分类。

如下图,模型(a)中

数据集的真实情况是:

a类有100个,b类有60个,c类有40个。

模型的结果为:

被分为a类的有120个,被分为b类的有60个,被分为c类的有20个。

每个行列的含义是:

第一行:a类的100个实例中,有88个被分为a类,有10个被分为b类,有2个被分为c类。

第二行:b类的60个实例中,有14个被分为a类,有40个被分为b类,有6个被分为c类。

其余的以此类推。

这样一来每个混淆矩阵的主对角线就是被正确分类的实例,如884012

例如下面的题:


共和党

民主党

无党派

共和党

42

2

1

民主党

5

40

3

无党派

0

3

4

(1)       分类的正确率和错误率分别是多少?

正确率:(42+40+4/42+2+1+5+40+3+0+3+4=86/ 100 = 86%

错误率:1-86%=14%

(2)   参议院中分别有几名民主党、几名共和党,几名无党派议员?

民主:5+40+3=48

共和:42+2+1=45

无党:0+3+4=7

(3)   有几名共和党人士被分类到民主党?有几名无党派人士被分类到共和党?

2个(第“共和党”行第“民主党”列)。

0个(第“无党派”行第“共和党”列)。

ü关于lift

lift值的应用:举例来说,如果一个公司对某一个群体进行发传单宣传。假设有10000人,其中响应(做出回应)的人有1000人,现在构造一个模型,这个模型的执行结果是,选出来4000人,这4000人中有800人是响应(做出回应)的。这样:

最初的比例是:1000/ 10000 = 0.1

模型计算后的比例为:800/ 4000 = 0.5

那么lift值为:lift= 0.5 / 0.1 = 5

Lift值是衡量模型好坏的一个指标,其含义是人群响应比提高的倍数。

例如下面的题:

考虑下面混淆矩阵,分别计算模型X与模型YLift,比较哪个模型更好?为什么?

模型X

计算接受

计算拒绝

    模型Y

计算接受

计算拒绝

接受

46

54

     接受

45

55

拒绝

2245

7655

     拒绝

1955

7945

思考方向:Lift的值是“模型计算后的响应比例”和“计算前的响应比例”的比值,所以只要计算前后的响应比例就可以了。

解:

对于模型X

计算前的响应比例是:(46+54/46+54+2245+7655=100/ 10000 = 0.01

计算后的响应比例为:46/2245+46=0.0200786 = 0.02(使用的是计算接受的一列)

lift值为:Lift(X)=0.02/ 0.01 = 2

同理,对于模型YLift值为:

Lift(Y)  =  [45/ (45+1955)]  /  [(45+55) / (45+55+1955+7945)]

=  0.0225 / 0.01

=  2.25

因为Lift(X) < Lift(Y)

所以模型Y比模型X好。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
P通信是一种基于数学理论的通信技术,它在通信领域具有重要的应用价值。数学理论是P通信的基础,下面将从几个方面解释其数学理论。 首先,P通信的数学理论中涉及了概率论与信息论。概率论是分析随机事件发生的概率、计算随机变量的特征和性质的数学理论。而信息论则研究信息的度量、编码、存储和传输等方面的问题。在P通信中,概率论的相关知识可以用来分析和描述信道中的噪声、干扰和误码率等情况,而信息论则可以用来优化编码方法,提高通信系统的可靠性和传输效率。 其次,P通信的数学理论中涉及了线性代数与矩阵理论。线性代数研究矢量空间、线性变换等代数结构的数学理论,而矩阵理论则研究矩阵的性质和运算规律。在P通信中,线性代数的相关知识可以用来描述信号的线性叠加以及信道中的线性传输特性,而矩阵理论则可以用来表示信号的转移矩阵、通信系统的状态空间模型等。 另外,P通信的数学理论中还涉及了数论和群论。数论研究整数的性质和运算规律,而群论则研究具有某些特定性质的代数结构。在P通信中,数论的相关知识可以用来研究编码和解码算法中的数学问题,而群论则可以用来研究密码学中的置换群与密码算法等。 综上所述,P通信的数学理论涵盖了概率论与信息论、线性代数与矩阵理论、数论和群论等多个方面的知识。这些数学理论为P通信的性能分析、信号处理和编码算法的设计提供了重要的理论基础,也为通信系统的优化和发展提供了有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值