![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 82
机器学习实战
Cpigpig
这个作者很懒,什么都没留下…
展开
-
机器学习 Logistic回归
机器学习中的logistic回归是一种常用的分类算法,它无需事先假设数据集分布,主要用于解决二分类问题,较少用来解决多分类的问题。我们从模型得到的预测类别的近似概率可以判断它是哪个类别,并且可以直接应用现有的数值优化算法求取最优的解,例如牛顿法也就是梯度下降法,还有最大似然估计等等。通过对logistic回归进行实验可以更好地理解该算法的性能和应用场景,从而更好地应用于实际问题中。原创 2023-12-02 15:33:16 · 828 阅读 · 0 评论 -
机器学习 支持向量机
我们需要找出分类器中定义的w和b,为此我们要找到具有最小间隔的数据点,找到之后对该间隔最大化,就可以写作:对上述的式子直接求解非常困难,所以我们要将它转换成另一件更加容易求解的形式,如果令上述式子中min括号中的乘法都为1的话,那么就可以变成求||w||最小值来求最终解,但是事实并非如此,只有那些离超平面近的才为1,离超平面越远这个值也就越大。我们要求解d的最大化问题转化乘求||w||的最小化问题,也就是。原创 2023-12-18 19:07:15 · 895 阅读 · 0 评论 -
机器学习 主成分分析
主成分分析是一种常用的数据分析方法。PCA通过线性变换将原始数据变换成一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。给定n个样本(每个样本维度为p维)定义为样本在第一主成分/主方向上的投影:其中我们的目标是找到,使得的方差最大。本篇文章首先介绍了维度约减,维度约减是为了减少样本中不重要的特征,保留关键的特征来描述数据,这样的处理可以提升分类或识别的精度,也可以避免数据在高维空间中过于稀疏导致过拟合。原创 2023-12-23 14:46:35 · 821 阅读 · 1 评论 -
机器学习实战KNN模型的性能度量以及PR和ROC曲线绘制
在我们将学习的模型构造出来训练完以后,我们通常需要评估该模型的好坏。原创 2023-10-23 17:45:00 · 457 阅读 · 0 评论 -
机器学习实战K近邻算法红酒分类实例
归一化主要的作用是防止有些特征差值过大,这些特征对计算结果的影响最大,导致结果不准确,而我们普遍认为每个特征都应该是同等重要的。为了避免这种情况,我们通常采用的方法是将数据归一化,将任意取值范围的特征值转化为0到1区间内的值。输入13.2 3.3 2.2 18.4 97 1.78 0.83 0.6 1.88 10.5 0.54 1.5 672测试数据。该分类算法采用的是欧几里得算法,计算两点之间的距离,选择距离最小的K个点然后返回分类结果。因为该数据集只有一百多个样例,所以这边选择取出数据的百分之三十。原创 2023-10-09 20:37:46 · 1200 阅读 · 1 评论 -
机器学习环境安装
右键选择以管理员身份运行至此vscode安装完毕。原创 2023-09-25 20:01:23 · 56 阅读 · 1 评论