机器学习(传统机器学习)
文章平均质量分 95
一九11111
持续更新中!
展开
-
机器学习(八) ----------支持向量积(SVM)
支持向量机(SVM)是一种强大的机器学习算法,其核心意义在于通过寻找决策超平面来实现数据的精确分类。SVM仅依赖于少量的关键样本点(支持向量)来构建决策边界,这使得它在计算上非常高效,尤其适用于大规模数据集。此外,SVM对噪声和异常值具有较强的鲁棒性,并且能够处理非线性可分问题,使得它在各种分类任务中都具有广泛的应用价值。通过优化结构风险,SVM旨在获得良好的泛化能力,使其对新数据也能做出准确的预测。原创 2024-05-18 19:37:38 · 1832 阅读 · 2 评论 -
机器学习(七) ----------聚类(K-means)
聚类分析是一种强大的数据分析技术,它能够在无监督学习的情境下,根据数据间的相似性和差异性,将数据自动划分为不同的类别或簇。这种方法广泛应用于市场细分、客户画像、图像处理、生物信息学等领域。通过聚类,我们可以发现隐藏在数据中的模式和结构,揭示数据的内在规律,为决策制定提供有力支持。聚类技术不仅提高了数据分析的效率和准确性,也推动了人工智能和大数据技术的发展。原创 2024-05-17 19:23:18 · 1124 阅读 · 3 评论 -
机器学习(六) ----------朴素贝叶斯+特征降维
PCA是一种通过降维来简化数据结构的方法,即把原有的多个指标转化成少数几个代表性较好的综合指标。这少数几个指标能够反映原来指标的大部分信息(80%以上),并且各个指标之间保持独立,避免出现重叠信息。原创 2024-05-16 15:27:45 · 856 阅读 · 1 评论 -
机器学习(五) ----------集成学习(2)(Adaboost算法+GDBT算法+XGBoost算法)
Boosting思想是一种强大的机器学习策略,它基于“知错就改”的原则,旨在通过迭代地训练多个弱学习器(如决策树)并将它们组合成一个强学习器,从而提升模型的预测能力。Boosting通过不断调整样本权重,使得先前学习器错误分类的样本在后续迭代中获得更多关注,从而逐步优化模型性能。这种策略不仅提高了模型的泛化能力,还使得模型对复杂问题的处理更加灵活和高效。原创 2024-05-15 19:27:05 · 1822 阅读 · 3 评论 -
机器学习(五) ----------集成学习(1)(集成学习思想+随机森林算法)
集成学习是一种强大的机器学习范式,它通过结合多个学习器的预测结果来提高模型的准确性和稳定性。这种方法的基本思想在于“多样性和投票”,即利用多个基学习器对输入数据进行独立的预测,并通过某种策略将这些预测结果综合起来,得到一个更加可靠的预测结果。原创 2024-05-14 20:23:12 · 1072 阅读 · 2 评论 -
机器学习(五) ----------决策树算法
决策树是一种直观且强大的机器学习算法,它通过树状结构将数据划分为不同的子集,从而进行预测和分类。该算法从根节点开始,根据数据的特征值逐步划分到子节点,最终到达叶节点得出分类或预测结果。决策树模型易于理解,可视化效果好,并且对于非专业人士来说也具有较高的可读性。此外,决策树还具有良好的处理缺失值和异常值的能力,广泛应用于金融、医疗、电商等领域的数据分析中。原创 2024-05-12 20:21:24 · 1424 阅读 · 10 评论 -
机器学习(四) ----------逻辑回归
逻辑回归,一种广泛应用于数据挖掘和机器学习领域的分类算法,其核心思想是通过构建模型来预测事件发生的概率。它采用sigmoid函数将线性组合的特征映射到概率值,实现数据的二元或多元分类。逻辑回归以其计算效率高、易于理解和实现等优点,在疾病预测、经济预测等方面发挥着重要作用。尽管它在线性分类上表现出色,但对于非线性问题则可能面临挑战。总的来说,逻辑回归是机器学习中一种实用且高效的分类算法。原创 2024-05-11 13:31:40 · 1146 阅读 · 1 评论 -
机器学习(三) ----------线性回归算法(梯度下降+正则化)
线性回归算法在机器学习中具有核心地位,它以其简单性和直观性为基础,为理解数据间的关系提供了基本框架。作为许多复杂算法的基础,线性回归不仅用于预测目标变量,还用于解释自变量对目标的影响。同时,它也是机器学习入门的经典算法,对于推广机器学习知识和技术具有重要意义。原创 2024-05-09 20:38:51 · 1327 阅读 · 1 评论 -
机器学习(二) ----------K近邻算法(KNN)+特征预处理+交叉验证网格搜索
KNN算法简单直观,易于理解和实现,并且不需要进行模型训练(即没有显式的训练过程)。然而,KNN算法的计算复杂度较高,特别是对于大型数据集,因为需要计算每个新数据点与所有已知数据点之间的距离。此外,KNN算法对数据的标准化和缩放等预处理步骤较为敏感,因为距离度量是基于特征空间中的数值大小。尽管如此,KNN算法仍然是机器学习领域中的一个重要工具,广泛应用于各种实际问题和场景中。原创 2024-05-06 13:44:55 · 1725 阅读 · 0 评论 -
机器学习(一) ----------机器学习概述
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,并重新组织已有的知识结构,使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。原创 2024-05-04 20:53:02 · 1170 阅读 · 0 评论