![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习自学整理
文章平均质量分 89
Demo_xxx
自动驾驶相关从业人员
展开
-
浅谈深度学习、Pytorch框架的一些必备的理论知识
机器学习20_一些理论知识一. 关键概念:算法(Algorithm):原本用以定义在解决问题时,按照某种固定步骤一定可以得到问题的结果的处理过程。后在数据科学领域,用以指代能够根据历史数据实现预测或得出某种结果的计算步骤或数学方法。人工神经网络(ANN):模拟人脑结构、复现人脑思考规律、以制造和人相似的智慧为目的的机器学习算法。机器学习(ML):使用计算机实现算法,使得计算机能够学习数据、获取经验。并实现于预测或得出结果的过程。深度学习(DL):以研究人工神经网络算法为核心的学科。原创 2022-02-06 14:56:46 · 2313 阅读 · 1 评论 -
机器学习之支持向量机简述(最大边界分类器:MMC;支持向量分类器:SVC;支持向量机:SVM)
机器学习22_支持向量机简述(2021.09.07)一. 引言:(摘自:https://ladychili.top/SVM/)机器学习研究者所说的 Support Vector Machines 通常泛指最大边界分类器 (Maximal Margin Classifier)、支持向量分类器 (Support Vector Classifiers) 和支持向量机 (Support Vector Machine) 三者。其本质都是构造linear decision boundary,前者分别是后者在数据纬原创 2021-09-07 14:04:44 · 2142 阅读 · 0 评论 -
机器学习之决策树的连续值、缺失值处理
机器学习22_决策树的连续值、缺失值处理(2021.09.03)一. 决策树连续值处理 - - - 引言:昨天讨论过的所生成的决策树,都是基于一些离散性的数据而生成的(例如上图蓝色圈圈内部有关色泽的属性);但是现实任务中常常会遇到连续的数据属性(例如上图红色圈圈内部有关密度的属性)。且由于连续属性的可取数目不再有限,因此,不能直接根据连续属性的可取值来对节点进行划分,此时,对于连续数据的离散化技术就可以派上用场了。其中,最简单的方法就是采用二分法对连续数据进行处理。二. 二分法处理连续值的过程(针对原创 2021-09-03 14:57:35 · 1659 阅读 · 0 评论 -
机器学习之决策树(熵、信息、噪音、熵量化、信息增益、信息增益率、基尼值、基尼指数)和逻辑回归树的详解
机器学习21_决策树(decision tree)逻辑回归树(regression tree)详解(2021.09.02)一. 究极总结决策树:一个定义在特征空间与类空间上的条件概率分布。逻辑回归树:解决逻辑回归问题的决策树。二. 知识储备什么是熵?一种事物的不确定性就叫做熵。比如我想买一颗西瓜,该挑哪一颗我不知道,我很不确定,这种感觉就被称作为熵。用数学的角度来解释就是:熵是描述系统状态的函数,也就是用来计算系统的混乱程度。什么是信息?信息就是可以用来消除不确定的事物。其作用就是:调整原创 2021-09-02 14:00:25 · 1237 阅读 · 0 评论 -
机器学习之线性判别分析(LDA)详解(附多维红酒数据集的LDA降维代码实现)
机器学习20_线性判别分析(LDA)详解(2021.07.07)一. 究极总结:投影后类内方差最小,类间方差最大。二. 知识理解LDA的思想非常朴素,给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离。在对新样本进行分类时,将其投影到同样的这条直线上,在根据投影点的位置来确定新样本的类别。如下图所示:在将所有的点通过降维的思想投影到直线上之后,实现了所谓的同类样例接近,异类样例远离的结果。如图中左边的理想情况,甚至可以找到一个法点以及它的法线原创 2021-07-07 17:27:43 · 2001 阅读 · 0 评论 -
机器学习之逻辑回归算法详解(Sigmoid函数、逻辑回归的损失函数、梯度下降 、逻辑回归的正则化、逻辑回归API中的超参数介绍)
机器学习19_逻辑回归算法详解(2021.06.07 ~)一. 究极总结逻辑回归:一个打着回归旗号,却在做分类任务的分类器。二. 必备知识复习逻辑回归在本质上其实是由线性回归衍变而来的,因此想要更好地理解逻辑回归,先让我们复习一下线性回归。线性回归的原理其实就是用一个线性回归方程来描述一个线性回归的问题。而线性回归的方程可以写作一个几乎大家都熟悉的方程:在这个方程中,w0被称作截距,w1 ~ wn 被称作系数,这个线性回归方程也可以用矩阵来表示:通过求出函数z,线性回归便完成了使用输入的特征原创 2021-06-07 18:48:41 · 5784 阅读 · 0 评论 -
机器学习之朴素贝叶斯算法的详解(包含高斯朴素贝特斯、多项式朴素贝叶斯、伯努利朴素贝叶斯,以及相应算法的简单实现)
机器学习18_贝叶斯算法详解(2021.06.02)一. 朴素贝叶斯算法为什么需要朴素贝叶斯算法?比如说,我们想预测一个人究竟是否能够侥幸在空难中生还,那么我们就需要建立一个分类模型来学习我们的训练集。在训练集中,其中一个人的特征是30岁,男,普通舱,他最终在空难中去世了。训练完成后,当我们使用训练好的模型进行测试的时候,测试的目标的特征也是30岁,男,普通舱,那么我们的模型必然会给这个人打上去世的标签。然而事实却不一定为此,也许这个人正好坐在了离逃生口最近的位置,他得到了第一时间的救治而生存下来了原创 2021-06-02 16:26:03 · 7137 阅读 · 1 评论 -
机器学习之欠拟合、过拟合详解(附实例和对应解决办法)
机器学习16_欠拟合、过拟合详解 (2021.05.31)一. 解惑什么是欠拟合、过拟合?⇒ 用两个通俗的案例让你更好地理解什么是过拟合和欠拟合案例1:现在有一组天鹅的特征数据,然后对模型进行训练。模型通过学习后得知:有翅膀嘴巴长的就是天鹅。之后使用该模型进行预测,该模型可能会将所有符合这两个特征的动物都预测为天鹅,比如鹦鹉、山鸡等等,这就导致了误差的产生。导致出现误差的原因就是:模型学习到的天鹅的特征太少了,导致区分标准太过于粗糙,从而导致不能准确地识别出天鹅。案例2:有了案例1的经验以后,原创 2021-05-31 17:44:50 · 8810 阅读 · 1 评论 -
机器学习之线性回归算法详解(附加利福尼亚房价预测的实现源码)
机器学习15_线性回归算法详解 (2021.05.30)一. 基础知识什么是回归问题?回归问题的本质又是什么?回归问题其实就是目标值是连续性的值,而分类问题的目标值则是离散型的值。回归处理的问题为预测,其本质都在于根据事物的相关特征预测出对应的结果值。比如:预测房价、预测销售额、设定贷款额度等。举一个生活中有关回归的例子: 预测学生的期末成绩已知了期末成绩的判定方法:0.7 x 考试成绩 + 0.3 x 平时成绩(该公式或者算法在别的线性回归算法中是根据数据推演出来的,而不是提前设置好原创 2021-05-30 23:04:58 · 3522 阅读 · 2 评论 -
机器学习之用于找到最优K值的K折交叉验证详解(附高阶鸢尾花分类的代码实现)
机器学习13_K折交叉验证(2021.05.27)一. 解惑为什么需要用到K折交叉验证?K值交叉验证的基本思想是什么?1.目的:虽然有时候画出了KNN算法的学习曲线,找到了貌似最优的K值,但在使用KNN算法进行模型的训练时,难免会出现由于刚好这组测试集的测试结果良好,而导致的预测或分类结果假好的情况。因此,为了选出最为合适的模型超参数K的取值,从而将该超参数K的值作用到模型的创建中,K折交叉验证就是必须的了。2.基本思想:将样本数据中的训练数据交叉地拆分出不同的训练集和测试集,使用交叉拆分出不同原创 2021-05-27 22:05:51 · 4115 阅读 · 0 评论 -
机器学习之KNN算法的详解(附鸢尾花分类的代码实现)
机器学习12_KNN算法(2021.05.26)一. 解惑KNN算法的全名是什么?KNN算法(K-NearestNeighbor)也称邻近算法,或者说K最近邻分类算法,该算法是数据挖掘分类技术中最简单的方法之一。什么是KNN算法?KNN算法其实就是根据数据之间的相似度来进行分类。简单地说,KNN算法通过测量待分类目标与已知分类目标之间的距离来进行分类。(近朱者赤近墨者黑)待分类的目标到已知分类目标之间的距离是怎样计算的呢?使用欧几里得距离公式,将每个待分类目标的每个特征值和已知分类的邻居的原创 2021-05-26 16:53:45 · 3984 阅读 · 0 评论 -
机器学习理论知识的自学整理(持续更新,建议收藏)
机器学习01_机器学习简介什么是机器学习?机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】或者对数据进行【分类】机器学习与人工智能的区别机器学习就是实现人工智能的一种技术手段什么是模型?模型又称算法模型,是一个特殊的对象。该算法模型对象中已经集成或者封装好了某种形式的方程(算法),但是还没有求出解。模型的作用?预测 - 可以通过方程或者算法产生一个新的未知的数据/事物分类 - 可以将一个未知类别的事物给其归类到一个已有的类群中注意:.原创 2021-05-18 17:36:39 · 614 阅读 · 1 评论