目录
前言
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的部分基础内容。
一、机器学习是什么?
机器学习:计算机无需明确编程即可学习的研究领域
二、机器学习的两种主要类型
1.Supervised leading(监督学习)
学习x到y或输入到输出映射的算法,关键特征是提供算法事例以供学习,最终学会直接受输入而不需要输入标签而给出合理的输出预测。例如垃圾邮件筛选、语音识别等。是实际应用最多并且已经看到了最新的进展和创新成果。
回归(regression):一种监督学习算法,学习从无限多可能数字中预测数字。例如房价预测类型的监督学习。
分类(classification):必须对一个类别进行预测,有一组可能的输出类别,例如0、1,肿瘤是否良性等。
2.Unsupervised learing(非监督学习)
目的是找到数据中的一些结构和模式,只是在数据中进行挖掘,没有类似肿瘤是良性还是恶性的标签,纯粹的基于数据。为了对每个输入给出正确的答案,要求我们的方法自己搞清楚数据特征,探索数据中的模式结构。无监督算法会给出两个不同的组或集群。
聚类算法(clustering algorithm):一种特殊的无监督学习,它将未标记的数据放置在不同的集群中,被证明可以在许多应用程序中使用。例如一些浏览器使用了聚类,点击词条后会看到下面的相关推荐,是利用聚类算法寻找文章。
异常检测(anomaly detection):用于检测异常事件,在金融领域应用很广。
降维(dimensionality reduction):将大的数据集压缩成一个小得多的数据集,并丢失尽可能少的信息。
三、Jupyter notebook
机器学习进行试验和尝试的默认环境。
可选实验室:可以一次打开并运行,通常无需自己编写任何代码,通过阅读和运行试验室里的代码,可以了解机器学习的代码运行方式