2022机器学习笔记
文章平均质量分 50
大米2H
这个作者很懒,什么都没留下…
展开
-
Lesson 8.1 决策树的核心思想与建模流程
GridSearchCV评估器参数与决策树使用方法原创 2022-10-25 00:15:12 · 133 阅读 · 0 评论 -
Lesson 6.3 正则化与sklearn逻辑回归参数详解
在了解了sklearn的一些常用的操作之后,接下来,我们来详细探讨关于正则化的相关内容,并就sklearn中的逻辑回归的参数进行详细解释。需要注意的是,由于sklearn内部参数的一致性,有许多参数不仅是逻辑回归的参数,更是大多数分类模型的通用参数。原创 2022-10-24 23:28:01 · 98 阅读 · 0 评论 -
Lesson 7.1 无监督学习算法与K-Means快速聚类(确定K值)
不过,尽管如此,其实K-Means快速聚类中,还是有部分指标可以一定程度上给出聚成几类的指导意见,其中最有名的就是轮廓系数(silhouette coefficient,简称sc)。并且,非常重要的一点是,轮廓系数取值的大小一定程度上能够给K的取值提供建议,当轮廓系数比较大时,往往说明数据在特征空间中本身的分布情况就和聚类的类别数量相同。尽管轮廓系数可以在[-1, 1]区间内取值,但我们并不希望轮廓系数出现负值,此时代表组内的平均距离要大于组外平均距离的最小值,此时说明聚类算法无效。原创 2022-10-10 23:50:59 · 160 阅读 · 0 评论 -
Lesson 7.1 无监督学习算法与K-Means快速聚类
尽管此前例子中K-Means的迭代过程快速高效,但实际上,当面对复杂数据集时,K-Measn很有可能陷入“局部最小值陷进”或者“震荡收敛”。所谓落入局部最小值陷进,指的是尽管可能有更好的划分数据集的方法(SSE取值更小),但根据K-Means的收敛条件却无法达到,算法会在另外一种划分情况时停止迭代;前种情况非常类似于参数进行梯度下降求解过程中,如果采用BGD,并且参数在一个局部最小值点附近,则最终参数会收敛到局部最小值点类似,而后面一种情况则非常类似于学习率过大导致无法收敛、一直处于震荡状态。原创 2022-09-06 23:38:43 · 108 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 5 分类模型决策边界与模型评估指标
1.准确率局限indexlabelsA-predictsB-predictspredicts_results110.80.61200.60.91300.20.40410.90.71510.90.61 如果是从准确率指标来看,两个模型在阈值为0.5的情况下,判别准确率都是80%(仅判错第二条样本),二者并无高下之分。但如果我们更加仔细的观察模型对各样本输出的概率欧安别结果,其实我们会发现模型A其实会更加“优秀”原创 2022-05-11 22:14:16 · 367 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.6 逻辑回归的手动实现
Lesson 4.6 逻辑回归的手动实现 讨论完梯度下降的相关内容之后,接下来我们尝试使用梯度下降算法求解逻辑回归损失函数,并且通过一系列实验来观察逻辑回归的模型性能。# 科学计算模块import numpy as npimport pandas as pd# 绘图模块import matplotlib as mplimport matplotlib.pyplot as plt# 自定义模块from ML_basic_function import *一、逻辑回归损失函数的梯度计原创 2022-04-10 21:37:57 · 1599 阅读 · 2 评论 -
2022机器学习实战课内容笔记 - Lesson 4.5 梯度下降优化基础:数据归一化与学习率调度
1原创 2022-04-06 22:59:52 · 824 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.4 随机梯度下降与小批量梯度下降
原创 2022-03-27 23:51:19 · 1008 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.3.1 梯度下降算法评价
原创 2022-03-24 23:46:18 · 1341 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.3 梯度下降及手动实现方式
原创 2022-03-20 12:11:10 · 711 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.2 极大似然估计、相对熵与交叉熵损失函数
原创 2022-03-19 11:20:04 · 267 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 4.1 逻辑回归模型构建:广义线性回归、对数几率函数与逻辑斯蒂分布
一、广义线性模型逻辑回归原创 2022-03-13 00:17:22 · 1582 阅读 · 1 评论 -
2022机器学习实战课内容笔记 - Lesson 3、 线性回归手动实现与模型局限
知识点补充 相关性系数计算# 科学计算模块import numpy as npimport pandas as pd# 绘图模块import matplotlib as mplimport matplotlib.pyplot as plt# 自定义模块from ML_basic_function import *一、线性回归的手动实现 接下来,我们尝试进行线性回归模型的手动建模实验。建模过程将遵照机器学习的一般建模流原创 2022-03-06 12:57:48 · 1344 阅读 · 1 评论 -
2022机器学习实战课内容笔记 - Lesson 2、矩阵运算基础、矩阵求导与最小二乘法
import numpy as npimport pandas as pd一、NumPy矩阵运算基础 在机器学习基础阶段,需要掌握的矩阵及线性代数基本理论包括:矩阵的形变及特殊矩阵的构造方法:包括矩阵的转置、对角矩阵的创建、单位矩阵的创建、上/下三角矩阵的创建等;矩阵的基本运算:包括矩阵乘法、向量内积、矩阵和向量的乘法等;矩阵的线性代数运算:包括矩阵的迹、矩阵的秩、逆矩阵的求解、伴随矩阵和广义逆矩阵等;矩阵分解运算:特征分解、奇异值分解和SVD分解等。补充知识:1.NumPy中的原创 2022-02-26 22:12:46 · 1093 阅读 · 0 评论 -
2022机器学习实战课内容笔记 - Lesson 1、机器学习基本概念与建模流程
还不是很会用ipad写笔记,没买类纸膜,字迹有点拉跨,请见谅本篇内容介绍内容为 以线性回归模型为例子介绍连续型变量的预测,并介绍最小二乘法求损失函数的最小值方法,以及损失函数与评估指标的区别 作为本节重点学习对象,此处我们整体梳理下机器学习的一般建模流程:Step 1:提出基本模型 如本节中,我们尝试利用简单线性回归去捕捉一个简单数据集中的基本数据规律,这里的y=wx+by=wx+by=wx+b就是我们所提出的基本模型。当然,在后续的学习过程中,我们还将接触诸多不同种类的机器学习模原创 2022-02-22 22:26:42 · 682 阅读 · 0 评论