机器学习
1.machine learning
1.1.Definition
Author Samuel(1959):未具体设计过程而使机器具有自主学习能力的领域
Tom Mitchell(1998):计算机程序自E(experience)中获得经验,解决任务T(task),进行某一性能度量P(performance),通过P测定在T上的表现因经验E而提高。
1.2 Supervised learning
监督学习:算法通过给定的正确数据集作为参考,输出更多可能的正确结果。
根据实际问题所需,以及类型推测,分为:
(Regression problem回归问题)即要尝试预测连续值(如下图)
(Classification problem分类问题)尝试预测离散值(如下图)
非监督学习:给定不具某种特征意义的数据集,从中发现结构关系并进行分类的机器学习算法。
以Google新闻为例,将具有同一新闻主题的各新闻机构的新闻拢列在一起(聚类算法)。如下图:
聚类算法的各种应用场景如下图:
聚类算法只是众多无监督学习中的一种。
2.model representation
2.1Linear regression with one variable
训练集与假设拟合函数
误差函数
当我们选择了某个假设函数之后,衡量其误差大小的方式就是用每个点处假设(预测)函数值减去这个点处的准确函数值。用以下(误差和平方函数)公式计算:
定义代价函数cost function为:
我们要通过寻找合适的,来使这个误差函数值最小。即误差函数最小时的。