熵和信息增益

(老师给出的例子,感觉非常直观,记录一下)

概念


在这里插入图片描述
信息增益
在这里插入图片描述

任务

· 使用解析特征化挖掘Big-University研究生的一般特征描述

· 给定属性: name, gender, major, birth_place, birth_date, phone#, and gpa
· Gen(ai) = ai上的概念层
· Ui = ai属性解析阈值
· Ti = ai 的属性归纳阈值
· R = 属性相关阈值

数据收集

· 目标类:研究生
· 对比类:本科生
· 使用Ui进行解析归纳

删除属性

删除 name and phone#

属性概化

概化 major, birth_place, birth_date and gpa
积累 counts值

候选属性

gender, major, birth_country, age_range and gpa
在这里插入图片描述

相关分析

计算给定样本分类所需要的期望信息
在这里插入图片描述

计算每一个属性的熵值 : e.g. major
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
——来自武汉大学洪亮老师的课堂:数据分析与管理

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值