![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
RyanWang0000
这个作者很懒,什么都没留下…
展开
-
模型选择与调优(KNN)
一、交叉验证(cross validation)将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。二、超参数搜索-网格搜索通常情况下,有很多参数是需要手动指定的(如k-近邻算法中的K值), 这种叫超参数。但是手动过程繁杂,所以需要对模型预设几种超...原创 2019-10-18 18:45:43 · 539 阅读 · 0 评论 -
特征预处理——降维
降维降维是指在某些限定条件下,较低特征的个数,得到一组“不相关”的主变量的过程1、特征选择原创 2019-08-02 18:51:17 · 331 阅读 · 0 评论 -
sklearn自带数据集的使用以及特征提取、特征预处理
一、sklearn自带数据集的使用1.导入鸢尾花数据集,查看你数据集的描述以及特征from sklearn.datasets import load_irisdef datasets_demo(): iris = load_iris() print("鸢尾花数据集:\n",iris) print("查看数据集描述:\n",iris["DESCR"]) pr...原创 2019-07-30 16:53:10 · 7011 阅读 · 0 评论 -
K-近邻算法(KNN)
1. 转换器回忆之前做特征工程的步骤:- 1 实例化(实例化的是一个转换器类)- 2 调用fit_transform(对文档建立分类词频矩阵)我们把特征工程的接口称之为转换器,其中转换器调用的形式是:fit_transformfit_transform是fit和transform的组合...原创 2019-08-13 18:39:33 · 224 阅读 · 0 评论