机器学习决策树算法解决图像识别

算法介绍

 什么是决策树算法

决策树又称判定树,是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。

构造决策树的基本算法

主要评估标准,准确率,速度,健壮性,可规模性,可解释性

样例:研究某人今天会不会出去玩?

历史数据:


从图片中可以看出来,此人前14天中9天出去玩,5天没有出去玩,其中由于天气情况原因,晴天2天出去玩,3天没有出去玩,阴天4天出去玩,0天没有出去玩,雨天3天出去玩,2天没有出去玩,然后由于湿度和风力影响,又有了下一轮决策是否出去玩的情况。以此类推分析分类此人是否会出去玩。

 

2.1.3 熵

  例子:猜世界杯冠军,假如一无所知,假如每个队夺冠的几率都是相等的,那么需要猜多少次?

 过程:是否是在前16只队伍中,32/2,用二分法可知,需要猜5次。

熵的单位是bit

info(D) = -(1/32*log(1/32)+1/32*log(1/32)+1/32*log(1/32) +1/32*log(1/32)+1/32*log(1/32)...)累加32次


info(D)= 5bit

结论:数据量越大,熵值越大,不准确率越高

 


熵的差值则为有条件后的概率优化程度,以前面的案例分析,如果直接猜测某人会不会出去玩。结果为:


如果加上天气情况分析,结果为:

所以在已知天气情况的条件下,数据准确率优化了0.246

 

2.1.4 算法优缺点

优点:直观,便于理解,小规模数据集有效

缺点:处理连续变量不好,类别较多时,错误增加的比较快,可规模性一般

 

 

2.2 逻辑分析

此时不得不让我非常开心,那如何利用决策树来做图像识别呢?对此还是让很多人无法理解,现在就慢慢向大家阐述。

再次对上述案例进行分析

天气

湿度

风力

是否出去玩

sunny

<=70

sunny

<=70

sunny

>70

不玩

sunny

>70

不玩

sunny

>70

不玩

overcast

overcast

overcast

overcast

rain

不玩

rain

不玩

rain

没风

rain

没风

rain

没风

然后程序化上述程序:

天气为三维,设置晴天为[1,0

  • 2
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值