学渣研究僧3-CSDN博客

1、首先尝试了运行Reset Spyder Setting没用，还是闪一下就没然后了2、尝试了删除C:\Users\用户名\ 路径下的.spyder-py3文件夹，依然没用、3、重装了更高版本的Spyder，依然没用4、在Anaconda Powershell Prompt (Anaconda)中输入命令 spyderspyder --new-instance得到错误原因Bad file descriptor (C:\ci\zeromq_1602704446950\work\src\epol

2021-04-28 12:11:41 6081 7

原创 F值、G-mean、AUC，三者平局值Average的曲线画法

import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import rcimport matplotlib as mplimport matplotlib.font_manager as fmmyfont=fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')mpl.rcParams['axes.unicode_minus']=Falserc('mathtext', d

2021-04-22 20:42:16 2783

原创 CluBagging的平均轮廓系数

import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import rcimport matplotlib as mplimport matplotlib.font_manager as fmmyfont=fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')mpl.rcParams['axes.unicode_minus']=Falseplt.rcParams['fo

2021-04-22 20:39:25 207

原创聚类性能度量

兰德指数：需要给出真实标签信息轮廓系数calinski_harabaz分数

2021-03-29 17:10:24 72

原创新版spyder中如何设置脚本文件共同使用同一个Variable explorer 中数据

经典，更新这玩意更得解决措施如下：将红框框里的东西选中就Ok啦。spyder脚本无法访问variable explorer内的变量Spyder 脚本不能直接访问variable explorer 中已有的变量

2021-03-27 14:27:23 424

原创标签中文字过长如何将标签文字两行显示

如将plt.xticks(np.arange(len(S_D))+1,['决策树','神经网络','Bagging(决策树)','Bagging(神经网络)','SpeSBagging(决策树)','SpeSBagging(神经网络)','SpeSBagging(神经网络\n决策树)'])改成plt.xticks(np.arange(len(S_D))+1,['决策树','神经网络','Bagging\n(决策树)','Bagging\n(神经网络)','SpeSBagging\n(决策树)'

2021-03-26 14:20:05 1091 1

原创轮廓系数

import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import rcimport matplotlib as mplimport matplotlib.font_manager as fmmyfont=fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')mpl.rcParams['axes.unicode_minus']=Falserc('mathtext', d

2021-03-26 13:40:32 137

原创不平衡数据集主模块

from bao import *import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport matplotlib.font_manager as fmfrom collections import Counterfrom imblearn.over_sampling import BorderlineSMOTEfrom imblearn.over_sampling import SMOTEfrom s

2021-03-25 13:21:26 87 1

原创查找重复元素的所有索引值

题目：给定一个列表,请设计一个函数，实现传入一个target=3，输出3这个元素在列表a中的索引，输出格式如下：[0,7,13]a=[3,4,5,6,6,5,4,3,2,1,7,8,8,3]for index, nums in enumerate(a): if nums == target: b.append(index)print(b)...

2021-03-25 03:37:04 579

原创 make_classification

from collections import Counterfrom sklearn.datasets import make_classificationfrom imblearn.over_sampling import ADASYNX, y = make_classification(n_classes=2, class_sep=2, weights=[0.1, 0.9], n_inf

2021-03-24 20:46:02 667

原创不平衡数据集的获取

from bao import *import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport matplotlib.font_manager as fmmyfont=fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')np.random.seed(668)#random_state = 2df = pd.read_csv('C:\\Users\\宝荣

2021-03-24 20:10:02 214

原创在iris数据集上决策树算法和Bagging算法的简单对比

import pandas as pdfrom sklearn.model_selection import train_test_splitfrom bao import *from sklearn import datasets # 导入库iris = datasets.load_iris() # 导入鸢尾花数据X = iris.datay = iris.targetX=np.array(X)y=np.array(y)#print(type(x_train))x_train

2021-03-24 12:57:43 515

原创解决散点图中图例中文文字大小无法改变的问题

绘制散点图时代码如下：import numpy as npfrom bao import *from shujukuochong import *import matplotlib.font_manager as fmmyfont=fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')mpl.rcParams['axes.unicode_minus'] = Falsempl.rcParams['axes.unicode_minus']=Fals

2021-03-23 11:52:45 793 1

原创比值系数法故障散点图的画法

import numpy as npfrom bao import *from shujukuochong import *plt.figure(figsize=(15,9)) colvalue=['#FF8C00','#FF1493', '#8B4513','#FF69B4', '#A9A9A9','#000000','#0000FF', '#800080','#556B2F','#008000','#FF0000','#32CD32','#48D1CC'] marke

2021-03-22 23:53:42 165

原创多分类集成学习分歧度量的计算

上代码def f1(XX): A=[] #A为两个基分类器预测相同的个数 B=[] #B为量个基分类器预测不相同的个数 C=[] #用来存放多分类分歧度量值 for i in range(len(XX)): j=len(XX)-i-1 #print(j) if j>0: #print("ccc") for t in range(j):

2021-03-16 14:56:34 478

原创 #把列表的数据依次填入矩阵对角线的一侧，另一侧与之对称

以5行5列元素为例#把列表的数据依次填入矩阵对角线的一侧，另一侧与之对称import numpy as npfrom bao import *s=5#矩阵的行列数CC=np.array([0.3333333333333333, 0.3333333333333333, 0.2857142857142857, 0.38095238095238093, 0.19047619047619047, 0.14285714285714285, 0.23809523809523808, 0.2380952380

2021-03-16 14:44:55 228

原创 office2019将UCI上下载的.data文件导入excel

如车辆信息数据数据集数据量特征数类别简单分布是否有缺失值来源vehicle846184212/218/199/217否UCL下载到文件夹中将data文件选择打开方式用记事本打开将所有数据粘贴到新建的chelaingxinxi.txt文件中新建一个excel文件选择从文本导入数据选择chelaingxinxi.txt文件启用编辑选择按字符数分隔数据txt文件中数据以什么分隔此处就以什么分隔完成后点击关闭并上载得到想要的数据表

2021-03-15 12:10:50 2030

原创对iris部分数据集进行采样

from sklearn import datasets # 导入库import numpy as npfrom collections import Counteriris = datasets.load_iris() # 导入鸢尾花数据#print(iris.data.shape,iris.target.shape) # (150, 4) (150,) 数据类型#print("\n")#print(iris.feature_names) # [花萼长，花萼宽，花瓣长，花瓣宽] 属性

2021-03-15 09:53:38 187

原创 fetch_lfw_people相关

from sklearn.datasets import fetch_lfw_people#导入数据集，第一次可能等待时间过长，因为要在网上下载数据集import matplotlib.pyplot as pltpeople = fetch_lfw_people(min_faces_per_person=2,resize = 0.7)print(people.target_names)print("图像个数以及像素:{}".format(people.images.shape))#(9164, 87

2021-01-19 11:01:56 1541

原创爬虫小记

import urllib#import urllib2baidu = urllib.request.urlopen(‘https://www.baidu.com/’)#请求网页baidu = baidu.read()print(baidu[:200])#打印网页中前200个字符的个数，进而可以看到页面开端print(len(baidu[:200]))#字符串中字符串的个数也可以用len()查url = ‘http://google.com?q=’url_with_query = url +

2020-12-19 11:45:10 51 1

原创针对cannot import name ‘joblib’ from ‘sklearn.externals’

这里写自定义目录标题此时有两种解决办法（1）将joblib包复制到externals文件夹中（2）不用（1）那么麻烦#网上有说是因为sklearn版本太新了回退版本即可其实不需要这么麻烦，无法从某个地方导入某个包，说明这个地方没有这个包通过Anaconda Prompt 使用conda install joblib安装joblib包在Anaconda Prompt中输入conda search joblib搜寻结果如下：可以看到我们已经从网上下载好了包此时在spyder中输入imp

2020-12-11 11:23:27 13044 7

原创 cross_val_score默认scoring

是accuracy

2020-11-18 14:41:56 1041

原创 cannot import name ‘joblib‘ from ‘sklearn.externals‘解决方法之一

(base) C:\Users\asus>pip show joblibName: joblibVersion: 0.16.0Summary: Lightweight pipelining: using Python functions as pipeline jobs.Home-page: https://joblib.readthedocs.ioAuthor: Gael VaroquauxAuthor-email: gael.varoquaux@normalesup.orgLicen

2020-10-28 22:18:49 5357

原创 ‘＜=‘ not supported between instances of ‘numpy.ndarray‘ and ‘int‘错误的一种可能

不能再机器学习算法中添加注释，否则该注释将被看作算法中的参数，类型为str,fit时将报错如下MLPClassifier("""hidden_layer_sizes=[10,10], activation='relu', solver='lbfgs', alpha=0.0001, batch_size='auto', learning_rate='constant', learning_rate_init=0.001, power_t=0.5, max_iter=200, shuffle=True

2020-09-17 11:43:00 3350

原创热力图画法

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltdf = pd.read_csv(‘C:\Users\asus\Desktop\Spyder代码\pokemon.csv’)print(df.shape)#数据集的形状print(df.info)#数据集的具体信息#计算各个特征缺失值所占百分比percent_missing = df.isnull().sum() * 100 / len(df)prin

2020-09-11 18:14:28 538

原创 pipeline相关知识

pipeline 有以下妙用：1、便捷性和封装性：直接调用fit和predict方法来对pipeline中的所有算法模型进行训练和预测。2、联合的参数选择：你可以一次grid search管道中所有评估器的参数。3、安全性：训练转换器和预测器使用的是相同样本，管道有助于防止来自测试数据的统计数据泄露到交叉验证的训练模型中。sklearn.pipeline.Pipeline(steps, memory=None, verbose=False)参数详解：steps : 步骤：使用（key, valu

2020-09-03 19:21:10 259

原创 os模块相关知识点

import osprint(os.name)#返回操作系统的名字，Windows 返回 ‘nt’; Linux 返回’posix’。注意该命令不带括号。#以下命令基本都带括号print(os.getcwd())#获取当前工作的目录print(os.listdir(‘C:\Users\asus\Desktop\课题资料’))#使用os.listdir时记住路径加冒号反双斜杠，而不是单斜杠print(os.listdir(‘C:\Users\asus\Desktop\lianxi’))#os.r

2020-07-07 16:46:48 263

原创 spyder 中安装包的方法

!pip install wordcloud（wordcloud为包的名称）因为有时候用conda install package_name不好用

2020-06-11 21:04:59 2514

原创 * params，** params：收集参数和分配参数

* params，** params：收集参数和分配参数‘* params’ 参数前面的星号将*后面多的所有值放入同一元组。def print_params_2(title,*params): print (title) print (params)print_params_2('Params:', 1, 2, 3) 输出如下：**params 为双*后面的关键字参数的“聚集”运算符。def print_params_3(**params): print

2020-06-06 10:36:16 1231

原创 python中计时方法

import timetic = time.time()#time.sleep(5)(此行可以换成需要计时的模块)toc = time.time()shijian = toc-ticprint(shijian)

2020-05-31 22:10:44 17213

原创单位向量法三维故障散点图的画法

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.preprocessing import StandardScalerfrom sklearn.datasets import make_moons,make_circles,make_classificationfrom sklearn.neig

2020-05-31 19:53:28 423

原创通过原数据集实现产生任意个任意数据量大小的子集

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.preprocessing import StandardScalerfrom sklearn.datasets import make_moons,make_circles,make_classificationfrom sklearn.nei.

2020-05-24 16:45:18 158

原创更改spyder工作目录

仅更改可能不会起作用，需要把运行文件以及数据文件都存放到工作目录的路径上转载于

2020-05-24 09:24:25 1650

原创使用lightgbm进行故障诊断

import pandas as pdfrom sklearn.model_selection import GridSearchCVimport lightgbm as lgbfrom sklearn.metrics import f1_scorefrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.datasets import make_classificationimport numpy as np

2020-05-23 11:46:30 800

原创打印机器学习算法的具体参数

使用print查到参数后可使用相关方法优化from sklearn import datasetsfrom sklearn.model_selection import train_test_split,cross_val_scorefrom sklearn.linear_model import LogisticRegressionfrom sklearn.naive_bayes import GaussianNBfrom sklearn.ensemble import RandomFores

2020-05-23 11:45:33 356

原创各算法决策边界的画法

未对难区分故障进行增加import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.preprocessing import StandardScalerfrom sklearn.datasets import make_moons,make_circles,make_classificationfrom

2020-05-23 09:27:20 1774 1

原创寻找列表或一维数组中出现次数最多的元素

寻找列表或一维数组中出现次数最多的元素import numpy as npdef toupiao(data): #定义一个函数 dict1 = {} #建立一个空字典 if type(data) is list:#判断数据类型，若为列表直接下一步 s = set(data)#去除重复元素后，看数据有哪些值 for i in s: j = data.count(i)#计算每个元素数目 dict1[

2020-05-22 20:49:46 591

原创贝叶斯优化文摘

相关调参算法机器学习即机器通过某种算法学习数据的计算过程，学习得到的模型本质上是一些列数字，如树模型每个节点上判断属于左右子树的一个数，或者逻辑回归模型里的一维数组，这些都称为模型的参数。那么定义模型属性或者定义训练过程的参数，我们称为超参数，超参数的选择对模型最终的效果有极大的影响。如复杂的模型可能有更好的表达能力来处理不同类别的数据，但也可能因为层数太多导致梯度消失无法训练，又如learning rate过大可能导致收敛效果差，过小又可能收敛速度过慢。机器学习模型超参数调优一般认为是一个黑盒优化问题

2020-05-16 09:50:11 511

转载屏蔽python运行时产生的FutureWarning信息

屏蔽python运行时产生的FutureWarning信息import warningswarnings.filterwarnings("ignore")

2020-05-14 23:49:48 3984

空空如也

空空如也