在这一部分学习中,我将跟这吴恩达教授学习算法方面的知识。
1.首先何为机器学习:
机器学习(Machine Learning)是一种人工智能(Artificial Intelligence)的分支领域,它涉及开发和应用能够从数据中自动学习和改进的算法和模型。机器学习的目标是让计算机系统通过数据和经验,不断地提高其性能和效果,而无需显式地进行编程。简单来说就是通过正确的答案,与回答对计算机系统进行培训,让它可以提升自己的性能。
2.机器学习分为什么部分呢:
机器学习算法可以可以分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、半监督学习(Semi-Supervised Learning)和强化学习(Reinforcement Learning)等不同类型。
我们在这一节中主要选择监督学习与无监督学习两种类型。
3.监督学习算法:
监督学习算法可以概括为input到output的一个过程,也就是一个给予机器输入与输出,从而让它的性能进行提升。监督学习的目标是基于这些已知的输入-输出对,构建一个模型,能够对新的、未知的输入数据进行预测或分类。
在这里主要有两个算法,回归算法与分类算法。
a.何为回归算法,目标输出是连续的数值。模型的任务是根据输入特征预测一个数值。常见的回归算法有线性回归、支持向量回归、决策树回归等。举个例子,比如:给了你的房地产部分平方米与价格的关系,从而让我们推测出在特定的平方米下的价格,这时我们得到的房价是不是从大量数据中得到一个数据,这就是回归算法。
b.何为分类算法,模型的任务是根据输入特征将数据进行分类。常见的分类算法有逻辑回归、决策树分类、支持向量机、朴素贝叶斯、神经网络等。它会有几个固定的分类,而在有限个种类中,他需要把他们放在不同的类别下,这里注意分类算法是在有限个选项下的。
4.无监督学习算法:
在无监督学习中,我们处理的数据没有预先标记的目标输出或结果。相反,我们的目标是从未标记的数据中发现数据的内在结构、模式或规律。简单来说我们就只是为了找到某种规律。
而在无监督学习算法中,我们主要要知道的有聚类算法,降维算法和异常检测
a.何为聚类算法,聚类是将相似的数据点分组到一起的任务,每个组被称为一个簇。聚类算法试图通过计算数据点之间的相似性或距离度量,将数据点划分为不同的簇。常见的聚类算法包括K均值聚类(K-means Clustering)、层次聚类(Hierarchical Clustering)和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等,就是把他们变成一个簇集,分别开来,但他们并没有任何的标签。
b.何为降维,降维是减少数据维度的过程,目的是保留数据的重要信息,同时减少冗余和噪声。降维可以帮助我们可视化高维数据、减少计算复杂度,并去除数据中的冗余特征。常见的降维算法有主成分分析(Principal Component Analysis,PCA)和 t-SNE(t-distributed Stochastic Neighbor Embedding)等,简单来说就是对数据集进行一个压缩,让它从一个大数据集变成一个小的数据集。
c.何为异常检测,故名思义就是对异常进行发现与检测,异常检测的目标是从数据集中识别出与正常行为或模式明显不同的数据点。这些异常数据点可能是由于错误、欺诈、系统故障、异常事件或罕见事件等原因引起的。异常检测的应用范围广泛,包括网络入侵检测、信用卡欺诈检测、设备故障检测、异常行为检测等。