Sklearn
程旭员
人生苦短,我用Python
GitHub:https://github.com/MrLuoj
展开
-
Sklearn专题实战——针对Category特征进行分类
文章目录1.前言2.数据处理3.模型构建3.1.支持向量机3.2.贝叶斯4.网格搜索寻找最优结果5.保存模型+提取模型6.混淆矩阵查看分类效果1.前言上次回我们是对文本进行情感分类,这次将实战一个稍微复杂的Category分类,即针对每个文本分类处是属于什么类型的文本,如属于电子类、服装类等等。2.数据处理class Category: ELECTRONICS = "ELECTRONICS" BOOKS = "BOOKS" CLOTHING = "CLOTHING"原创 2020-05-27 15:33:54 · 993 阅读 · 1 评论 -
Sklearn专题实战——数据处理+模型构建+网格搜索+保存(提取)模型
文章目录1.前言2.数据处理3.模型构建3.1.支持向量机3.2.决策树3.3.逻辑回归4.网格搜索寻找最优结果5.保存模型+提取模型1.前言针对Sklearn在前面已经通过代码实战讲解了其中的各个主要模块,现在将从整体的角度深度理解一下Sklearn, 本文主要以代码形式讲解,在代码中有注释,话不多说,开车!!!(请坐稳)数据链接密码:a6vy2.数据处理class Sentiment: NEGATIVE = "NEGATIVE" NEUTRAL = "NEUTRAL"原创 2020-05-25 11:37:44 · 1335 阅读 · 1 评论 -
Sklearn——保存模型参数(pickle&joblib)
文章目录1.前言2.pickle 保存3.pickle 保存1.前言我们训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。今天主要介绍两种保存Model的模块pickle与joblib。2.pickle 保存首先简单建立与训练一个SVC的Model。from sklearn import svmfrom sklearn...原创 2020-03-31 15:40:34 · 4209 阅读 · 1 评论 -
Sklearn——交叉验证(Cross Validation)
文章目录1.前言2.非交叉验证实验3.交叉验证实验4.准确率与平方误差4.1.准确率实验1.前言Sklearn 中的 Cross Validation (交叉验证)对于我们选择正确的 Model 和 Model 的参数是非常有帮助的, 有了它的帮助,我们能直观的看出不同 Model 或者参数对结构准确度的影响。2.非交叉验证实验from sklearn.datasets import lo...原创 2020-03-31 15:39:38 · 2996 阅读 · 1 评论 -
Sklearn——对数据标准化(Normalization)
文章目录1.前言2.数据标准化3.对比标准化前后3.1.数据标准化前3.2.数据标准化后1.前言由于数据的偏差与跨度会影响机器学习的成效,因此正规化(标准化)数据可以提升机器学习的成效2.数据标准化from sklearn import preprocessing #导入用于数据标准化的模块import numpy as npdata = np.array([[13,54,7,-5]...原创 2020-03-30 10:43:09 · 7422 阅读 · 4 评论 -
Sklearn——用Sklearn实现线性回归(LinearRegression)
文章目录1.前言2.Sklearn实战线性回归2.1.导入必要模块2.2.加载数据2.3.训练+预测1.前言Sklearn 中的datasets,很多而且有用,可以用来学习算法模型。比如: boston 房价, 糖尿病, 数字, Iris 花。也可以生成虚拟的数据,例如用来训练线性回归模型的数据,可以用函数来生成。例如,点击进入 boston 房价的数据,可以看到 sample 的总数...原创 2020-03-30 10:41:38 · 8792 阅读 · 2 评论 -
Sklearn——用Sklearn实现K近邻分类(KNN)
文章目录1.前言2.KNN实战2.1.导入必要模块2.2.加载数据2.3.训练+预测1.前言Sklearn 把所有机器学习的模式整合统一起来了,学会了一个模式就可以通吃其他不同类型的学习模式。例如,分类器,Sklearn 本身就有很多数据库,可以用来练习。 以 Iris 的数据为例,这种花有四个属性,花瓣的长宽,茎的长宽,根据这些属性把花分为三类。我们要用分类器去把四种类型的花分开。K...原创 2020-03-29 10:16:53 · 20987 阅读 · 2 评论 -
Sklearn——Sklearn的介绍与安装
文章目录1.Sklearn简介2.Sklean安装2.1.pip安装2.2.conda安装1.Sklearn简介Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式:Classification 分类Regression 回归Clustering 非监督分类Dimensionality re...原创 2020-03-29 10:15:32 · 4537 阅读 · 0 评论