本文用于复习《Machine Learning》第一章部分内容
内容来自于Andrew Ng的机器学习课程,主要是为了回忆起来方便
第一章前三讲主要讲解的是一些概念的区分,以理解的方式了解不同的分类方法和问题
supervised learning
这里supervised learning是指,给算法一个数据集合,利用算法即可得到实际结果,例如一个特定的值(平均房价1万/平方米),例如一个特定判断(整个病症不是癌症)
supervised learning包含两种问题:
- regression problem: 对于连续值进行预测,例如房价等
- classification problem: 对于离散值进行预测,例如判断是否,或是多种结果
unsupervised learning
这里unsupervised learning是指,给算法一个无区分标签的一组数据(在使用数据之前不知道数据分组),利用算法得到几个区分群,例如从一堆新闻中划分出关于同一个故事的
linear regression
由上易知,linear regression即是回归问题的线性处理方式。例如给出基本参数:
- m: 数据的组数,训练房屋的数量
- x: 输入变量,特征值,房屋的面积
- y: 输出变量,结果值,房屋的价格
- (x,y): 一个训练样本,某一个房屋的面积对应的房屋价格
线性回归所要处理的即是:
(1)得到数据集x
(2)得到需要运用的算法为线性回归算法
(3)利用房屋面积x和房屋的价格y建立预测关系h(hypothesis),得到h(x)=b+ax