sklearn
佛系小狼
这个作者很懒,什么都没留下…
展开
-
解决:PackagesNotFoundError: The following packages are not available from current channels:
首先我们需要使用anaconda search -t conda sklearn来查询可用的包,然后会显示然后使用conda install -c https://conda.anaconda.org/gafortiby sklearn-pandas来进行安装原创 2020-05-06 21:11:30 · 1886 阅读 · 0 评论 -
sklearn.datasets中的几个函数make_moons(), make_circles(), make_classification()
1、make_moons()sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)制作月亮型数据。重要参数:n_samples:设置样本数量、noise:设置噪声、random_state:设置随机参数(嘿嘿,无所谓,随便设),我们主要讲参数noise(1)将noise设...原创 2020-04-02 11:53:53 · 8572 阅读 · 0 评论 -
python数据预处理 :样本不均衡(过采样、欠采样、设置权重、集成方法)
何为样本不均衡:样本分布不均衡就是指样本差异非常大,例如共1000条数据样本的数据集中,其中占有10条样本分类,其特征无论如何你和也无法实现完整特征值的覆盖,此时属于严重的样本分布不均衡。为何要解决样本不均衡:样本分部不均衡的数据集也是很常见的:比如恶意刷单、黄牛订单、信用卡欺诈、电力窃电、设备故障、大企业客户流失等。样本不均衡将导致样本量少的分类所包含的特征过少,很难从中提取规律,即使得...原创 2020-03-12 11:54:59 · 3421 阅读 · 0 评论 -
Grid网格搜索、网格搜索+交叉验证==》 GridSearchCV
转载自:https://www.jianshu.com/p/55b9f2ea283b转载 2020-09-01 19:28:47 · 139 阅读 · 0 评论