![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python机器学习
文章平均质量分 84
执志@☆飞扬か
这个作者很懒,什么都没留下…
展开
-
【机器学习08】层次聚类
9 层次聚类9.1 简介层次聚类分为两种类型:聚合(agglomerative)或自下而上(bottom-up)聚类分裂(divisive)或自上而下(top-down)聚类凝聚层次聚类(AGNES):属于聚合或自下而上聚类步骤:构造mmm个类,每个类包含一个样本,即有多少个样本就有多少个类计算类与类之间的距离dijd_{ij}dij,记作矩阵D=[dij]m∗mD=[d_{ij}]_{m*m}D=[dij]m∗m合并间距最小的两个类若达到聚类数KKK则退出重新计算类之间的原创 2022-05-13 23:41:57 · 917 阅读 · 0 评论 -
【机器学习07】K-Means聚类(聚类篇)
8 K-Means聚类(聚类篇)8.1 简介聚类(Clustering):是一种无监督学习算法,即将无分类的数据分为K类K-Means(K-均值)聚类:选取K个初始聚类中心(质心)步骤:repeat:对每个样本点,计算得到距其最近的质心,将其类别标为该质心所对应的cluster重新计算K个cluster对应的质心until:质心不再发生变化8.2 距离计算公式(1)Minkowski(闵可夫斯基距离,若p=2,则成为欧式距离) d(x,y)=(∑原创 2022-05-08 23:37:29 · 1331 阅读 · 0 评论 -
【机器学习06】多项式回归
7 多项式回归若希望回归模型更好的拟合训练样本数据,可以使用多项式回归器一元多项式回归hθ(x)=θo+θ1x+θ2x2+θ3x3+…+θnxn将高次项看做对一次项特征(自变量)的扩展得到:hθ(x)=θo+θ1x1+θ2x2+θ3x3+…+θnxn那么一元多项式回归即可以看做为多元线性回归,可以使用LinearRegression模型对样本数据进行模型训练所以一元多项式回归的实现需要两个步骤:将一元多项式回归问题转换为多元线性回归问题(只需给出多项式最高次数即可)将步骤1得到多项式的结原创 2022-05-07 23:47:34 · 545 阅读 · 0 评论 -
【机器学习05】LASSO回归与ElasticNet(弹性网)
5 LASSO回归5.1 简介LASSO回归:在模型迭代过程所依据的代价函数中增加了正则惩罚项(L1范数正则化),以限制模型参数对异常样本的匹配程度,进而提高模型面对多数正常样本的拟合精度,解决过拟合问题代价函数:J(θ)=12m∑i=1m(hθ(x(i))−y(i))2+λ∥θ∥1=12m∑i=1m(hθ(x(i))−y(i))2+λ∑j=1n∣θj∣J(\theta)=\frac{1}{2m}\sum\limits_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2+\la原创 2022-05-06 23:03:18 · 1447 阅读 · 0 评论 -
【机器学习04】岭回归
4 岭回归4.1 简介普通线性回归模型使用基于梯度下降的最小二乘法,在最小化损失函数的前提下,寻找最优模型参数,在此过程中,包括少数异常样本在内的全部训练数据都会对最终模型参数造成程度相等的影响,异常值对模型所带来影响无法在训练过程中被识别出来岭回归:在模型迭代过程所依据的代价函数中增加了正则惩罚项(L2范数正则化),以限制模型参数对异常样本的匹配程度,进而提高模型面对多数正常样本的拟合精度,解决过拟合问题正则化:目的:防止过拟合本质:约束(限制)要优化的模型参数代价函数:J(θ)=12原创 2022-05-05 22:59:29 · 5101 阅读 · 6 评论 -
【机器学习03】线性回归(回归篇)
3 线性回归(回归篇)3.1 形式化定义假设函数(hypotheses function)hθ(x)=θ0+θ1x1+θ2x2+...+θnxn=∑i=0nθixi=θTxh_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n=\sum\limits_{i = 0}^n{{\theta_i}{x_i}}={\theta^T}xhθ(x)=θ0+θ1x1+θ2x2+...+θnxn=i=0∑nθixi=θTx其原创 2022-05-03 22:42:00 · 627 阅读 · 0 评论 -
【机器学习02】数据预处理
2 数据预处理数据预处理的过程:输入数据——>模型——>输出数据数据样本矩阵【一行一样本,一列一特征】年龄学历经验性别月薪25硕士2女1000020本科3男8000……………数据预处理相关库:# 解决机器学习问题的科学计算工具包---数据预处理库import sklearn.preprocessing as sp【机器学习基础】Python数据预处理:彻底理解标准化和归一化2.1 均值移除(标准化)由于一个样本原创 2022-05-03 22:37:59 · 577 阅读 · 0 评论 -
【机器学习01】概述
1 机器学习概述1.1 什么是机器学习机器学习是一门能够让编程计算机从数据中学习的计算机科学一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以 衡量的P,随着E的增加而增加,那么这样计算机程序就被称为机器学习系统自我完善、自我增进、自我适应1.2 为什么需要机器学习自动化的升级和维护解决那些算法过于复杂甚至根本就没有已知算法的问题在机器学习的过程中协助人类获得对事物的洞见1.3 机器学习的问原创 2022-05-03 22:30:16 · 662 阅读 · 0 评论