第1章 机器学习基础
机器学习能让我们自数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的真实含义。
本系列笔记后续所有代码均使用python3改写。
1.1 何谓机器学习
简单来说,机器学习就是把无序的数据转换成有用的信息。它横跨计算机科学、工程技术和统计学(为了解决无法精确建立数学模型等问题,我们需要用到统计学工具)等多个学科,需要多学科的专业知识。大量的经济活动都依赖于信息,我们不能在海量的数据中迷失,机器学习将有助于我们穿越数据雾霭,从中抽取出有用的信息。
1.2 关键术语
书中所给例子为构建一个鸟类专家系统,为了区分不同鸟类,(这里规定)需要使用四个不同的属性值:体重、翼展、有无脚蹼和后背颜色。这四种值就称之为特征(features)或者属性(attributes),而表中的每一行由特征组成的一组数据数据称为一个实例(instance)(如第一行,1000.1 125.0 No Brown)。
这个例子是一个典型的分类(classification)任务,所以我们决定要使用某个机器学习算法进行分类。