机器学习基础
文章平均质量分 96
湘粤Ian
热爱AI的湘粤Ian
展开
-
机器学习06|两万字:决策树 【jupyter代码详解篇】
本文用到的所有数据决策树(Decision Tree)首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析,本质上是通过一系列规则对数据进行分类的过程决策树是一种典型的分类方法。CLS算法是早期提出的决策树学习算法,是很多决策树学习算法的基础框架。依据其中选择分类属性的策略不同,可以得到不同的决策树算法。比较常用的决策树有ID3,C4.5和CART三种和实现,其中CART一般优于其他决策树,并且可用于回归任务。下面我们将编写代码实现这三种决策树算法。原创 2022-11-04 21:41:34 · 3294 阅读 · 6 评论 -
机器学习05|一万五字:SVM支持向量机02 【jupyter代码详解篇】
支持向量机(SVM)在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。本资料包含了SVM的完整解析及全部实现代码。从DataSet.txt中导入数据一直讲到SVM的线性非线性实现。原创 2022-10-29 16:36:27 · 2393 阅读 · 15 评论 -
机器学习05|一万五字:SVM支持向量机01 【原理详解篇】
支持向量机(SVM)在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。本资料包含了SVM的完整解析及全部实现代码。从DataSet.txt中导入数据一直讲到SVM的线性非线性实现。原创 2022-10-29 11:59:38 · 1421 阅读 · 0 评论 -
机器学习04|两万五字:optimizer优化器 【详解及jupyter代码】
在这一节中,我们将构建一个三层的神经网络来处理手写数字识别问题,之后我们将运用AdaGrad、RMSprop、Momentum、Nesterov Momentum和Adam优化算法来加速梯度下降的过程,首先我们先来实现一个简单的神经网络。原创 2022-10-12 19:41:54 · 874 阅读 · 0 评论 -
机器学习03|万字:正则化 【详解及jupyter代码】
在这个实验中,是以Logistic回归作为基础,将再次复习Logistic回归,对Logistic回归将有更深的理解。通过对比未进行正则化的Logistic回归与正则化的Logistic回归在相同数据集上的表现来理解正则化缓解过拟合现象的作用。原创 2022-09-21 21:54:33 · 1335 阅读 · 0 评论 -
机器学习01|一万五字:线性回归【详解及jupyter代码】
单变量线性回归的模型由两个参数θ0\theta_0θ0,θ1\theta_1θ1Peakdemand≈θ0+θ1⋅(Hightemperature)。我们的目标也就是找到一条"最符合"的直线,确定这条直线的参数θi\theta_iθi。原创 2022-09-18 19:07:34 · 2318 阅读 · 1 评论 -
机器学习02|六千字:逻辑回归 【详解及jupyter代码】
做机器学习应用的时候很多时间是花费在特征处理上,我们注意到原始数据存在许多维度为非数字的数据,是不能直接用于构建模型的。如教育程度:(小学,初中,高中+)可以被扩展到如下三个维度:小学学历(是,否),初中学历(是,否),高中学历以上(是,否)。经上述处理后的数据存储在X_train文件中,每个样本的维度被扩展到了106维,本实验直接使用X_train的数据构建模型。归一化把每个特征的数据映射到0到1之间,消除指标之间的量纲影响,同时可以避免某些特征对模型预测结果的影响过大。但作为优化目标时二者无不同。原创 2022-09-17 23:41:09 · 1875 阅读 · 1 评论