sklearn
文章平均质量分 90
以实战为线索,逐步深入sklearn的各个模块,打造完整Python工作流,提升工程化编码和思维能力。
微小冷
这个作者很懒,什么都没留下…
展开
-
sklearn线性模型之Lasso回归
就其形式而言,与岭回归是十分相似的,最大差别是惩罚因子为1范数,而岭回归是2-范数。这个微小的差别,导致二者在求解共线性问题得到了截然不同的结果,即在岭回归中,各参数之间不会产生较大差异,而Lasso回归时,更容易让共线性参数中的一个置零,从而使得结果变得稀疏。原创 2024-01-17 08:30:00 · 2428 阅读 · 0 评论 -
sklearn感知器分类
为了验证Perceptron的分类能力,下面生成生成1000组样本,每个样本有两个特征数,无冗余信息,且信息特征个数为1,每个类别由一组聚类组成。并且从生成样本中分别抽取一些数据,作为训练集和测试集。sklearn的linear_model中提供了感知器模型,其构造函数如下。接下来构造Perceptron,并且进行训练。感知器堪称最简单的神经网络,其特点如下。最后,绘图验证分割结果。原创 2024-01-16 08:15:00 · 1064 阅读 · 0 评论 -
sklearn岭回归
岭回归中,要求拟合参数$w$的值尽可能地靠近0,这种方案可以不局限于线性拟合,也可以应用在非线性拟合中。例如,对于$y=\vert\sin x\vert$这样的函数,其最小值显然在$x=0$处,但若没有一个$\alpha$这一项作为惩罚因子,那么关于$y=\vert\sin x\vert$的优化注定是发散的,因为$\sin x$是周期函数。原创 2024-01-14 08:15:00 · 1625 阅读 · 1 评论 -
sklearn主成分分析PCA
PCA,即主成分分析(Principal components analysis),顾名思义就是把矩阵分解成简单的组分进行研究,而拆解矩阵的主要工具是线性变换,具体形式则是奇异值分解。原创 2024-03-30 12:29:56 · 1913 阅读 · 0 评论 -
sklearn数据降维之字典学习
如果把降维理解成压缩的话,那么字典学习的本质是编码,其目的是找到少量的`原子`,用以描述或构建原始样本。原创 2023-01-22 07:45:00 · 1916 阅读 · 2 评论 -
sklearn聚类之谱聚类SpectralClustering
谱聚类是一种基于图论的聚类方法,所谓图,就是将空间中的所有点连接起来,只要这些连接中出现了一个圈,就可以称之为图。如果把这些连线加上一个权重,就叫做加权图。原创 2023-01-14 06:45:00 · 3620 阅读 · 1 评论 -
sklearn之朴素贝叶斯
简单起见,考虑到现在考研比较内卷,那么假设用三个指标评价是否录取,即本科是否为985;考研分数A(前10%),B(10%-30%),C(30%-60%),D(后40%)四档;本科发文章A(Nature级别), B(SCI),C(其他期刊),D(无期刊),现有一张录取表,我们可以通过这个来预测你是否能考上研。原创 2023-01-12 06:00:00 · 1777 阅读 · 1 评论 -
sklearn层次聚类AgglomerativeClustering
和Birch聚类相似,层次聚类也是一种依赖树结构实现的聚类方法,其核心概念是相似度。根据相似度,可以将所有样本组织起来,从而构建一棵层次聚类树。原创 2023-01-05 06:30:00 · 5748 阅读 · 1 评论 -
sklearn聚类之OPTICS算法
OPTICS算法,全称是Ordering points to identify the clustering structure,是一种基于密度的聚类算法,是DBSCAN算法的一种改进。原创 2023-01-10 06:45:00 · 3078 阅读 · 0 评论 -
sklearn机器学习之DBSCAN聚类
和其他聚类算法相比,DBSCAN存在一种去中心化的特性,即不存在一聚类中心,这样做的好处是,在面对不规则的数据时,有着更好的聚类效果。原创 2023-01-08 06:30:00 · 4420 阅读 · 1 评论 -
sklearn之K-Means聚类
在`KMeans`最重要的概念是簇,也就是被分割后的数据种类;而每个簇都有一个非常重要的点,就是质心。原创 2022-12-17 07:15:00 · 4149 阅读 · 0 评论 -
【Python】sklearn机器学习之Birch聚类算法
BIRCH,即Balanced Iterative Reducing and Clustering Using Hierarchies,利用分层的平衡迭代规约和聚类,特点是扫描一次数据就可以实现聚类,而根据经验,一般这种一遍成功的算法,背后一定有一棵树,而这棵树的生成规则,往往就是算法的核心。Birch算法的核心,叫做聚类特征树(Clustering Feature Tree),简称CF树。原创 2023-01-01 06:30:00 · 2749 阅读 · 0 评论 -
sklearn之AP聚类AffinityPropagation
Affinity Propagation按照字面意思就是亲和力传播,可见这个算法的关键就是亲和力与传播。说到传播,无外乎两件事,第一件事,传的是什么,暂且先不用管,因为名字里已经说了,传的是亲和度;第二件事,怎么传,为了解决这个问题,就必须造一条传递亲和力的通道。原创 2022-12-29 07:00:00 · 2526 阅读 · 4 评论 -
【Python】sklearn机器学习之Meanshift聚类算法
凡聚类者,必有中心。按照这个思路,如果某个区域满足聚类的要求,那么其自然中心与样本均值应该是几乎重合的,这也是MeanShift算法的基本逻辑。原创 2023-01-03 06:00:00 · 1940 阅读 · 2 评论