本人CSDN博客专栏:https://blog.csdn.net/yty_7
Github地址:https://github.com/yot777/
好了,机器学习进入正题了,我们从大家身边的实例开始讲起。
什么是标签
标签,通俗的讲是对某人某事物的凭经验的分类 。
大家都知道,人有高矮胖瘦之分,那么高是怎样定义出来的呢?
我查了一下,“高”在字典里的解释是:从下向上距离大;离地面远(跟“低”相对)。为什么解释“高”,要扯到“低”?
为了弄清楚“高”,我又查了一下“低”:从下向上距离小;离地面近(跟“高”相对)。
真想用爱情公寓里陈美嘉的名言对字典说:“我一口盐汽水喷si你!”
总之呢,从字典里搞清楚“高”是不可能的。但是我们每个人确实都觉得有的人长得高,有的人长得低(矮),这又是为什么呢?
什么是特征
如果你问姚明,觉得什么人算长得高?他可能会说:2米以上算长得高!
如果你问美女模特,觉得什么样的男人算长得高?她可能会说,1米75以上算长得高!
如果你问普通男人,觉得什么样的女人算长得高?他可能会说,1米6以上算长得高!
如果你问非洲某小人国部落,他可能会说,1米以上就算是巨人了!
明白了吗?其实大家心里都有一杆秤啊!标签的背后,是有某种可以量化为数字的指标做支撑,这就叫特征。
特征和标签的配对
好了,解释了特征和标签,现在我们可以进行特征和标签的配对了。接着上面的话题:
姚明眼中的人类:
特征(身高,以米为单位) | 标签 | |
A | 1.51 | 矮 |
B | 1.61 | 矮 |
C | 1.76 | 矮 |
D | 2.1 | 高 |
美女模特眼中的人类: