之前直接看吴恩达老师的深度学习课程,发现有很多看不明白的地方,所以还是从吴恩达老师讲的机器学习开始看,感觉自己真的基础知识太差了,很多东西都要慢慢补出来
机器学习的定义
定义搬运链接:link
从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。
从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
机器学习的主要类型
一、监督学习(supervised learning)
小赵笔记:根据给定x和y,学习x到y的映射关系,若观测变量Y是连续的则属于回归模型,若Y是离散的是属于分类模型,回归模型预测的结果是连续的数值,分类模型只有少数可能的输出。
经典案例是根据已有房价特征及对应房价预测房价和根据给定数据预测肿瘤是否为良性
监督学习的两种主要类型
(一)回归(regression)
(二)分类(classification)
二、无监督学习(unsupervised learning)
小赵笔记:聚类算法是无监督学习的一种,谷歌新闻应用聚类算法将可能是相同类型的文章分为一组(没有给学习数据)。
在监督学习中,数据有输入x和输出标签y;而在无监督学习中,数字只有输入x,但没有输出标签y,而我们的无监督算法必须从数据中找到一些结构、模式或一些有趣的东西。
无监督学习的主要类型
(一)聚类(clustering):将同类型的数据聚合到一起
(二)异常检测(anomaly detection):找到不寻常的数据(事实证明这对金融系统的欺诈检测非常重要)
(三)降维(dimensionality reduction):将一个大数据集尽可能的压缩成一个小的数据集,同时丢失尽可能少的信息