CS229 讲稿
吴恩达
监督学习[ Supervised learning ]
来看一些关于监督学的问题. 假如我们有波特兰地区47幢房屋的居住面积与价格的数据集[ dataset ].
居住面积 ( 平方英尺 ) 价格 ( 1000美元 )
2104 400
1600 330
2400 369
1416 232
3000 540
...
...
我们可以在画出这些数据:
数据如上图显示, 我们怎么才能学会一个函数以波特兰地区其它房屋的使用面积来预测价格?
建立一些符号来供我们学习, 我们用 来表示输入变量[ input variables ] ( 上例中的房屋面积 ) 称为输入特征[ input features ],
来表示输出或目标变量[ output or target variable ] 我们尝试预测输出变量( 价格 ). 一对
称为一个训练样本[ training example ], 含有 m 个训练样本
的数据集称为训练集合[ training set ]. 上标 "
" 是一个对于数据集的索引, 不是幂函数. 我们经常使用 X 来表示输入变量