Machine Learning❤️
该专栏主要为机器学习、深度学习等相关笔记和算法实现以及使用各种算法处理数据集的案例
逐梦er
ACM铜牌退役狗、机器学习炼丹师、懒癌晚期患者
展开
-
机器学习入门笔记总目录
机器学习入门笔记是我参考周志华老师的《机器学习》西瓜书、李杭老师的《统计学习方法》第二版以及课程教材等资料写的。该目录主要记录关于机器学习和算法基本概念的博客链接。——————————————————————————————————————好好学习,好好努力,希望自己能够坚持下去!!!目录机器学习的基本概念和相关术语https://blog.csdn.net/qq_43328040/article/details/106823245机器学习入门笔记(一):模型性能评价与选择https:原创 2020-06-28 16:51:44 · 10863 阅读 · 42 评论 -
机器学习入门笔记(七):聚类
文章目录一.聚类的基本概念1.1 相似度或距离1.2 类或簇1.3 类与类之间的距离二.层次聚类2.1 基本概念2.1 算法描述2.3 例题三.K均值聚类3.1 模型3.2 策略3.3 算法3.3.1 K-Means ++ 中的聚类中心初始化算法:3.3.2 聚类数 K 的确定3.3.3 K均值聚类算法描述3.4.例题四.密度聚类(DBSCAN)4.1 相关概念4.2 算法描述一.聚类的基本概念聚类是针对给定的样本,依据它们特征的 相似度或距离,将其归并到若千个“类”或“簇”的数据分析问题。一个类是样原创 2020-06-27 18:29:29 · 9872 阅读 · 0 评论 -
机器学习入门笔记(六):集成学习
集成学习(ensemble learning) 通过构建并结合多个学习器来完成学习任务,有时也被称为 多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning) 等。这一章的内容大致如下:个体与集成:同质集成和异质集成有什么不同?集成学习对个体学习器有什么要求?集成学习研究的核心是什么?集成学习分哪两大类?Boosting:Boosting的基本概念?AdaBoost算法的流程?如何基于加性模型最小化指数损失函数来推导?原创 2020-06-26 12:16:27 · 11133 阅读 · 0 评论 -
机器学习入门笔记(五):决策树
文章目录一.决策树模型与学习1.1 决策树模型1.2 决策树与 if-then 规则1.3 决策树与条件概率分布1.4 决策树的学习二.特征选择2.1 信息增益2.2 例题:利用信息增益求解问题2.3 信息增益比三.决策树的生成3.1 ID3算法3.2 例题:利用ID3算法建立决策树3.3 C4.5算法决策树(decision tree) 是一种基本的分类与回归方法.本章主要讨论 用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if−then是if-th原创 2020-06-25 14:55:22 · 12717 阅读 · 10 评论 -
机器学习入门笔记(四):朴素贝叶斯分类
文章目录一.朴素贝叶斯法1.1 实现原理1.2 后验概率最大化二.朴素贝叶斯法的参数估计2.1 极大似然估计2.2 学习与分类算法2.3 朴素贝叶斯分类器例题2.4 贝叶斯估计一.朴素贝叶斯法朴素贝叶斯(naive Bayes)法 是基于贝叶斯定理与特征条件独立假设的分类方法.对于给定的训练数据集,首先基于特征条件独立假设 学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法.本章叙述朴素贝原创 2020-06-24 21:48:57 · 15606 阅读 · 1 评论 -
机器学习入门笔记(三):K近邻算法
文章目录一.K近邻算法的基本概念1.1 K近邻算法实现二.K近邻分类三要素2.1 距离度量2.2 K值的选择2.2.1 基于m-fold cross validation的 K值选择2.3 决策规则2.3.1 多数表决规则( majority voting rule)2.3.2 基于距离的加权投票三.k近邻算法的实现:kd树3.1 构造kd树3.2 搜索kd树一.K近邻算法的基本概念k近邻算法简单、直观:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例 最邻近的k个实例,这k个实例的多数原创 2020-06-24 14:14:42 · 10412 阅读 · 0 评论 -
机器学习入门笔记(二):线性模型
文章目录一.基本形式二.线性回归2.1 离散属性连续化2.2 最小二乘法2.3 多元线性回归2.4 广义线性模型三.对数几率回归(逻辑回归)3.1 最大似然估计四.线性判别分析(LDA)五.类别不平衡问题5.1 欠采样5.2 过采样5.3阙值移动一.基本形式给定由d个属性描述的示例 x= (x1; x2; …; xd) ,其中 xi 是 x 在第 i 个属性上的取值, 线性模型(inear model) 试图学得一个通过属性的线性组合来进行预测的函数,即:一般用向量形式写成:其中 w= (w1;原创 2020-06-23 21:01:39 · 10629 阅读 · 4 评论 -
最小二乘法求回归直线方程的详细推导过程
转载自:http://blog.csdn.net/marsjohn/article/details/54911788——————————————————————————————————————————————————在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者 正相关 或者 负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线转载 2020-06-23 19:16:41 · 25518 阅读 · 0 评论 -
机器学习入门笔记(一):模型性能评价与选择
文章目录一.训练误差与测试误差1.1基本概念1.2训练误差1.3泛化误差(测试误差)1.4过拟合二.模型评估方法2.1 留出法(hold-out)2.2正则化2.3 交叉验证2.4 自助法一.训练误差与测试误差1.1基本概念在分类任务中,通常把错分的样本数占样本总数的比例称为错误率(error rate)。比如m个样本有a个预测错了,错误率就是 E = a/m;与错误率相对的 1 - a/m 称为精度(accuracy),或者说正确率,数值上 精度 = 1 - 错误率。更一般地,我们通常会把学习器的原创 2020-06-22 13:43:28 · 13379 阅读 · 14 评论 -
机器学习的基本概念和相关术语
文章目录一.什么是机器学习二.机器学习的相关术语三.机器学习的典型任务四.假设与假设空间五.假设的选择原则六.机器学习的三要素一.什么是机器学习人工智能标准化白皮书(2018版)机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,研原创 2020-06-18 11:07:18 · 37242 阅读 · 20 评论 -
《机器学习实战》第二章学习笔记:K-近邻算法(代码详解)
文章目录1、k-近邻算法概述1.1准备:使用python导入数据1.2 实施KNN分类算法1.3如何测试分类器2.示例: 使用k-近邻算法改进约会网站的配对效果2.1准备数据:从文本文件中解析数据2.2 分析数据:使用matplotlib创建散点图2.3 准备数据:归一化数值2.4测试算法:作为完整程序验证分类器2.5 使用算法:构建完整可用系统3.示例:手写识别系统3.1 准备数据:将图像转换为测试向量3.2 测试算法: 使用K-近邻算法识别手写数字《机器学习实战》数据资料以及总代码可以去GitHub中原创 2020-06-17 12:07:02 · 6136 阅读 · 0 评论