概念学习可近似为分类问题,例如一个小孩子看过几种鸟的图片,如果再给他一张另外一种没见过的鸟的图片,他还是可以认出这是只鸟,换句话说他已经建立了“鸟”这一概念,进而根据一些特征进行判断是或不是属于这个概念。
一、概念和概念学习的定义
概念是在一个更大的集合里面定义一个对象或者事物的子集,或者说是一个从更大的集合里面学到的布尔函数。
概念学习,指自动地给出概念的定义。也就是说概念学习是从训练数据中学到一个符合训练数据的二元函数。从机器学习的角度,也可以说概念学习是一个在假设空间中的假设搜索问题。
例子:
概念:“days on which my friend enjoys water sports”
学习任务:从其他属性里面预测enjoysport的值
假设是属性的合取,是一个约束向量,例如<Sunny,Warm,Normal,Strong,Warm,Same>
属性的取值有三种,1)任意取值都可以<?> 2)其中某个值,注意是某一个值而不是多值的组合,例如<Warm> 3)任意取值都不可以
实例的项集:指属性名。例如:<sky temp humid wind water fore-cast >
要学习的概念叫做目标概念:即enjoysport的取值c:X->{0,1}
训练数据:实例x的集合和目标概念的值即<x,c(x)>
概念学习过程:在假设空间中寻找一个合适的假设,h:X->{0,1},对任意的x,使得h(x)=c(x)
总结一下:
给出:实例X(属性集合),目标函数c{0,1},假设空间H,训练数据<x,c(x)>
求:合适的
注: