机器学习实战笔记——机器学习基础

最新推荐文章于 2024-05-06 21:43:07 发布

yuexiahandao

最新推荐文章于 2024-05-06 21:43:07 发布

阅读量211

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/yuexiahandao/article/details/82882522

版权

6 篇文章 0 订阅

订阅专栏

机器学习基础

1. 机器学习分为监督学习和无监督学习。

2. 监督学习一般使用两种类型的目标变量：标称型和数值型

3. 我们可以将数据集分为测试集、验证集和训练集。

4. 关于交叉验证：将数据集分为多个部分，随机选取一个作为测试集，其他的都是训练集。

5. 简单地说，机器学习就是将无用的数据转化为有用的信息。将无联系的数据转化为有序的价值。

6. 前期的ETL就是建立数学模型来解决问题。而机器学习是数据算法转化数据的价值。

7. 数据的采集：各种数据的采集是各种系统的运行结果，最重要的数据采集来自于传感器数据。

8. 机器学习的主要任务就是分类，使用标称型的数据。机器学习的另一个任务就是回归。分类和回归属于监督学习，之所以被称为监督学习，是因为这类算法必须知道预测什么，即目标变量的分类信息。

9. 无监督学习：数据没有类别信息，也不会给定目标值。在无监督学习中，将数据集合分成由类似的对象组成的多个类的过程被称为聚类；将寻找描述数据统计值的过程称之为密度估计。无监督学习还可以减少数据特征的维度，以便我们可以使用二维或三维图形更加直观地展示数据信息。

10. 如何选择合适的算法

上面提到的原则不是一成不变的，要敢于打破常规解决问题。除此之外也有其他的考量指标：

同时还要尝试不同的算法的执行效果，一般来说发现最好算法的关键环节是反复试错的迭代过程。

11. 机器学习开发的步骤：

12. NumPy函数库的使用基础知识。

关注