![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 51
「已注销」
这个作者很懒,什么都没留下…
展开
-
AttributeError: ‘RandomUnderSampler‘ object has no attribute ‘fit_sample‘
python用RandomUnderSampler库下采样的时候,报的错原代码:from collections import Counterfrom imblearn.under_sampling import RandomUnderSamplertrain = pd.read_csv('./data/0504_ftr.csv')test = pd.read_csv('./data/0504_fte.csv')y = train['label']-1del train['labe原创 2021-05-06 19:54:11 · 4392 阅读 · 2 评论 -
(学习)读官方文档:from sklearn.ensemble import AdaBoostClassifier
目标:使用AdaBoostClassifier实现多分类解决方法:(1)网上搜索案例(2)查看官方文档 or 命令行使用help()这次想用一下help(),突破一下。首先,python命令行输入help()help()然后,出现如下,输入sklearn.ensemblePACKAGE CONTENTS(包的内容) _bagging _base _forest _gb _gb_losses _gradient_boost...原创 2021-05-06 11:04:04 · 1510 阅读 · 1 评论 -
(学习)python库StratifiedKFold交叉验证的使用
基本用法: >>> import numpy as np >>> from sklearn.model_selection import StratifiedKFold >>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]]) >>> y = np.array([0, 0, 1, 1]) >>> skf = StratifiedKF原创 2021-05-05 18:06:02 · 642 阅读 · 0 评论 -
(自用)链接收藏
python实现各种机器学习库:Python使用sklearn库实现的各种分类算法简单应用小结_python_脚本之家 (jb51.net)原创 2021-05-05 17:43:50 · 113 阅读 · 0 评论 -
(傻瓜教程)Stacking&Blending——鸢尾花数据集为例
1、Stacking做一个分类模型,先确定输入、输出、处理。输入:训练集:鸢尾花数据集(150行,4个属性,1列标签,标签为1、2、3)测试集:假设有20行测试集(与150行无关,无真实值标签,4个属性)输出:预测的标签处理:(1)数据集的处理:5折交叉验证,每折30行(2)模型选择:第一层模型选择xgboost、gbdt、rf;第二层模型选择LR(3)stacking:首先,第一层:xgboost对tr2tr3tr4 tr5训练,对tr1测试,得到一个...原创 2021-05-05 13:54:59 · 549 阅读 · 0 评论 -
(笔记)pandas学习(持续更新......)
(1)打印某列的唯一值真是能偷懒,hhhh正经写法:print(train['label'].unique())原创 2021-05-03 22:26:17 · 88 阅读 · 0 评论 -
CUDA error 35: CUDA driver version is insufficient for CUDA runtime version
MobaXterm服务器端服务器端运行报错:按照网上的方法依次检查服务器型号自然是一点看不懂。但最后一个false明显有问题。尝试解决。(解决CUDA driver version is insufficient for CUDA runtime version - PilgrimHui - 博客园 (cnblogs.com))我的身份验证不能通过。啊,这。。。。。本地pycharm把文件下载到本地,在本地pycharm中运行:(小2G的数据)运行报错:原创 2021-05-03 20:28:55 · 6461 阅读 · 0 评论 -
(笔记)模型融合&集成学习
Reference links are as follows:模型融合方法总结 - 简书 (jianshu.com)为什么说模型融合会提升性能? (回归问题也一样) 模型融合怎么更有效? 具体模型融合的方法?基础:分类:link:https://gitmind.cn/app/doc/17a1626348我目前的理解是集成学习和模型融合是一个...原创 2021-05-03 20:12:55 · 127 阅读 · 0 评论 -
(笔记)宏平均和微平均
目录应用场景:多分类计算公式:例子:例(1)宏平均:微平均:例(2):宏平均:微平均:例(3):区别+更详细的应用场景:结论:应用场景:多分类计算公式:(转自:谈谈评价指标中的宏平均和微平均_chenpe32cp的博客-CSDN博客)两句话就是:宏平均先在每个类别上计算P、R、F值,再取平均,我猜它之所以叫宏平均就是因为它用到了÷n;(自己的猜测,帮助理解)微平均看总体的P、R,然后计算F;例子:例(1)(链..原创 2021-04-29 00:10:12 · 1964 阅读 · 1 评论 -
ValueError: Target scores need to be probabilities for multiclass roc_auc, i.e. they should sum up t
发现了一个很有趣的错误,标题计算多分类的ROC值,这个错误肯定不难。值的错误是因为ROC根据概率值,去判断测试集预测的是正例还是负例,所以在进行预测得时候,要预测概率,加个_proba我是在源代码发现这个错误的。定位到python内部的定义,人家官方给了例子,一看就知道哪里错了。...原创 2021-04-28 01:50:16 · 2901 阅读 · 0 评论 -
python+pycharm+pyspark+windows搭建spark环境+各种踩坑
python+pycharm+pyspark+windows搭建spark环境+各种踩坑 - 知乎 (zhihu.com)原创 2021-04-28 01:14:48 · 186 阅读 · 0 评论 -
numpy.AxisError: axis 1 is out of bounds for array of dimension 1
最讨厌这种看起来问题明明不大,但死活找不到对错的error经过仔细查看,有一个是dataframe类型,有一个是ndarray类型,我检查过了,长度一致,唯一的可能是库的版本问题,我也不知道什么库的版本可是,把ndarray类型的转化为dataframe类型的。numpy有点事多。...原创 2021-04-28 01:10:39 · 4334 阅读 · 2 评论 -
Py4JJavaError: An error occurred while calling o149.trainALSModel. : org.apache.spark.SparkException
原创 2021-04-23 19:16:16 · 1012 阅读 · 0 评论 -
机器学习周志华决策树预剪枝、后剪枝
原创 2020-03-28 21:18:32 · 674 阅读 · 1 评论 -
安装Graphviz + N次卸载重装anaconda+anaconda下安装Graphviz
1、安装graphviz(N次重装Anaconda见2)最近老师布置了一个决策树的作业,需要Graphviz库,经过网上多方借鉴,主要的方法包含两种:一种直接用python的底层安装,另一种为借助编辑器快捷安装先安装Graphviz,配环境变量,再安装pyGraphviz;(此种方法可在搜索栏键入:“python 安装Graphviz”)这里提供可能需要的文件。见下方第2个小点点 当然了...原创 2020-03-04 13:06:22 · 3003 阅读 · 0 评论