机器学习
文章平均质量分 78
从0到1机器学习
白拾
https://github.com/YangSierCode000 专注人工智能的情感研究,喜爱联邦学习和人工智能隐私安全方向,ACGN爱好者。正在努力肝论文中,真希望时间变慢一点啊。
展开
-
机器学习第七部分:模型优化
验证曲线与学习曲线 ① 验证曲线验证曲线是指根据不同的评估系数,来评估模型的优劣. 例如,构建随机森林,树的数量不同,模型预测准确度有何不同?以下是一个验证曲线的示例:1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556# 验证曲线示例i...原创 2021-11-30 06:19:00 · 459 阅读 · 0 评论 -
机器学习第六部分:模型评估
性能度量 ① 错误率与精度错误率和精度是分类问题中常用的性能度量指标,既适用于二分类任务,也适用于多分类任务.错误率(error rate):指分类错误的样本占样本总数的比例,即 ( 分类错误的数量 / 样本总数数量)精度(accuracy):指分类正确的样本占样本总数的比例,即 (分类正确的数量 / 样本总数数量)精度=1−错误率精度 = 1 - 错误率精度=1−错误率...原创 2021-11-25 06:31:14 · 528 阅读 · 0 评论 -
机器学习第五部分:降维问题
参见:机器学习四大降维方法 PCA降维参见:【机器学习】降维——PCA(非常详细)参见:机器学习实战8-sklearn降维(PCA/LLE) LDA降维参见:【机器学习实战】降维方法的sklearn实现----PCA和LDA LLE降维参见:机器学习实战8-sklearn降维(PCA/LLE) 拉普拉斯特征映射参见:python实现拉普拉斯特征图降维示例...原创 2021-11-25 06:31:07 · 92 阅读 · 0 评论 -
机器学习第四部分:聚类问题
聚类问题 概述聚类(cluster)与分类(class)问题不同,聚类是属于无监督学习模型,而分类属于有监督学习。聚类使用一些算法把样本分为N个群落,群落内部相似度较高,群落之间相似度较低。在机器学习中,通常采用“距离”来度量样本间的相似度,距离越小,相似度越高;距离越大,相似度越低. 相似度度量方式 ① 欧氏距离相似度使用欧氏距离来进行度量. 坐标轴上两点x1,x2x_1, x_2x...原创 2021-11-25 06:31:06 · 864 阅读 · 0 评论 -
机器学习第三部分肆:朴素贝叶斯
朴素贝叶斯是一组功能强大且易于训练的分类器,它使用贝叶斯定理来确定给定一组条件的结果的概率,“朴素”的含义是指所给定的条件都能独立存在和发生. 朴素贝叶斯是多用途分类器,能在很多不同的情景下找到它的应用,例如垃圾邮件过滤、自然语言处理等. 概率 定义概率是反映随机事件出现的可能性大小. 随机事件是指在相同条件下,可能出现也可能不出现的事件. 例如:(1)抛一枚硬币,可能正面朝上,可能反面朝...原创 2021-11-25 06:30:59 · 103 阅读 · 0 评论 -
机器学习第三部分叁:支持向量机(SVM)
基本概念 什么是支持向量机支持向量机(Support Vector Machines)是一种二分类模型,在机器学习、计算机视觉、数据挖掘中广泛应用,主要用于解决数据分类问题,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化(即数据集的边缘点到分界线的距离d最大,如下图),最终转化为一个凸二次规划问题来求解。通常SVM用于二元分类问题,对于多元分类可将其分解为多个二元分类问题,...原创 2021-11-25 06:30:58 · 422 阅读 · 0 评论 -
机器学习第三部分贰:决策树分类
什么是决策树决策树是一种常见的机器学习方法,其核心思想是相同(或相似)的输入产生相同(或相似)的输出,通过树状结构来进行决策,其目的是通过对样本不同属性的判断决策,将具有相同属性的样本划分到一个叶子节点下,从而实现分类或回归. 以下是几个生活中关于决策树的示例.【示例1】男生看女生与女生看男生的决策树模型【示例2】挑选西瓜的决策树模型在上述示例模型中,通过对西瓜一系列特征(色泽、...原创 2021-11-25 06:30:58 · 303 阅读 · 0 评论 -
机器学习第三部分壹:逻辑回归
逻辑回归 概述 什么是逻辑回归逻辑回归(Logistic Regression) 虽然被称为回归,但其实际上是分类模型,常用于二分类。逻辑回归因其简单、可并行化、可解释强而受到广泛应用。二分类(也称为逻辑分类)是常见的分类方法,是将一批样本或数据划分到两个类别,例如一次考试,根据成绩可以分为及格、不及格两个类别,如下表所示:姓名成绩分类Jerry861Tom...原创 2021-11-25 06:30:57 · 143 阅读 · 0 评论 -
机器学习第二部分下:决策树回归
决策树回归核心思想:相似的输入必会产生相似的输出。例如预测某人薪资:年龄:1-青年,2-中年,3-老年学历:1-本科,2-硕士,3-博士经历:1-出道,2-一般,3-老手,4-骨灰性别:1-男性,2-女性年龄学历经历性别==>薪资1111==>6000(低)2131==>10000(中)3341==&...原创 2021-11-25 06:27:23 · 427 阅读 · 0 评论 -
机器学习第二部分上:线性回归
线性模型线性模型是自然界最简单的模型之一,它描述了一个(或多个)自变量对另一个因变量的影响是呈简单的比例、线性关系.例如:住房每平米单价为1万元,100平米住房价格为100万元,120平米住房为120万元;一台挖掘机每小时挖100m3100m^3100m3沙土,工作4小时可以挖掘400m3400m^3400m3沙土.线性模型在二维空间内表现为一条直线,在三维空间内表现为一个平面,更高...原创 2021-11-25 06:27:22 · 483 阅读 · 0 评论 -
机器学习第一部分:概述
人工智能课程概述 什么是人工智能人工智能(Artificial Intelligence)是计算机科学的一个分支学科,主要研究用计算机模拟人的思考方式和行为方式,从而在某些领域代替人进行工作. 人工智能的学科体系以下是人工智能学科体系图:机器学习(Machine Learning):人工智能的一个子学科,研究人工智能领域的基本算法、原理、思想方法,机器学习研究的内容在其它子学科都会...原创 2021-11-25 06:26:23 · 281 阅读 · 0 评论