2019年04月_YZXnuaa

转载【Sklearn】DecisionTreeClassifier

1.scikit-learn决策树算法类库介绍　　　　scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法，既可以做分类，又可以做回归。分类决策树的类对应的是DecisionTreeClassifier，而回归决策树的类对应的是DecisionTreeRegressor。两者的参数定义几乎完全相同，但是意义不全相同。下面就对DecisionTreeClassifier...

2019-04-27 09:51:03 1608

转载【Graphviz】绘制流程图

前言日常的开发工作中，为代码添加注释是代码可维护性的一个重要方面，但是仅仅提供注释是不够的，特别是当系统功能越来越复杂，涉及到的模块越来越多的时候，仅仅靠代码就很难从宏观的层次去理解。因此我们需要图例的支持，图例不仅仅包含功能之间的交互，也可以包含复杂的数据结构的示意图，数据流向等。但是，常用的UML建模工具，如Visio等都略显复杂，且体积庞大。对于开发人员，特别是后台开发人员来说，命令...

2019-04-26 19:37:01 1264

原创【Sklearn】决策树可视化（未完成）

个人总结困难之处有三点：1、属性存在二元属性、标称属性、序数属性、连续属性四种，训练方式没有可视化比较混乱；2、每个步骤有足够的意义，所以需要观察分类过程；3、不同于难以解释的神经网络，或者分离超平面可以用一个式子表达，决策树划分结果通常需要语言描述；1、等高线方法，只能观察两种特征值对结果的影响，当特征增多时，等高线图呈现平方级数增长详情：Sklearn官方demo，使用经典...

2019-04-26 18:19:15 339

原创【Graphviz】数据网络的布局软件

一、认识graphviz接触graphviz是几年前的一个项目，要画出数据网络的布局，使用graphviz能比较清楚的画出数据之间的关系。可以在gallery中查看他能完成的图形：http://www.graphviz.org/gallery/。graphviz最方便的地方在于能够很快的清晰的画出点与点之间的关系，并且有许多布局算法能够很好的去布局。之前使用它画过流程图，如：ima...

2019-04-26 17:48:52 634

转载【Sklearn】决策树可视化 InvocationException: GraphViz's executables not found

仅仅安装pydotplus不够，需要安装独立Graphviz软件一、安装Graphviz网站：http://www.graphviz.org/download/下载msi文件直接安装，完成之后添加环境变量：在path中将Graphviz的bin的目录路径添加上；二、安装pydotplus打开Anaconda Prompt,输入pip...

2019-04-26 17:17:20 322

原创【Sklearn】tree.export_graphviz 可视化函数

Parameters: decision_tree:decision tree regressor or classifier The decision tree to be exported to GraphViz. out_file:file object or string, optional (default=None) Handle or n...

2019-04-26 15:15:35 11290

转载【Numpy】ravel()、flatten()、squeeze()

numpy中的ravel()、flatten()、squeeze()都有将多维数组转换为一维数组的功能，区别：ravel()：如果没有必要，不会产生源数据的副本flatten()：返回源数据的副本squeeze()：只能对维数为1的维度降维另外，reshape(-1)也可以“拉平”多维数组参见官方文档：ravel()flatten()squeeze()...

2019-04-26 12:52:46 206

原创 Meshgrid函数（未完成）

Meshgrid函数的基本用法meshgrid函数用两个坐标轴上的点在平面上画网格。用法：　　[X,Y]=meshgrid(x,y)　　[X,Y]=meshgrid(x)与[X,Y]=meshgrid(x,x)是等同的　　[X,Y,Z]=meshgrid(x,y,z)生成三维数组，可用来计算三变量的函数和绘制三维立体图这里，主要以[X,Y]=meshgrid(x,y)为例，...

2019-04-26 00:27:40 363

原创 Python Matplotlib 等高线

CS = plt.contour(X, Y, Z, n(层数), alpha=0.75（透明度）,cmap=plt.cm.hot（渐变标准）) # cmap解析其中前两个参数x和y为两个等长一维数组，第三个参数z为二维数组（表示平面点xi,yi映射的函数值）。由于contourf可以填充等高线之间的空隙颜色，呈现出区域的分划状，所以很多分类机器学习模型的可视化常会借助其展现。...

2019-04-26 00:15:58 536

原创 Python Matplotlib属性 cmap

cmap即colormaps获取图谱使用plt.get_cmap(‘xxx’)其值有很多，如官网：https://matplotlib.org/users/colormaps.html或https://matplotlib.org/examples/color/colormaps_reference.html如：plt.contourf(X,Y,Z,6,cmap=plt.get...

2019-04-26 00:06:34 21240 1

转载 max()中key的使用

1.找出绝对值最大的元素t=[1,5,-6,-4]ans=max(t,key=lambda k:abs(k))print(ans) #-61232.找出句子中最长的单词x=’i want a banana’ans=max(x.split(),key=len)Print(ans) #’banana’1233.找出句子中ASCII码最大的单词x=’i wa...

2019-04-25 09:06:09 1961

转载返回一个列表中出现次数最多的元素

def zuiduo_yuansu(): a=list(input('请输入任意个元素：')) print(max(a,key=a.count))zuiduo_yuansu()lt = ['李白', '李商隐', '李贺', '李清照', '李煜', '李杰', '杜甫', '杜牧', '白居易', '李白', '李清照', '岳飞', '李白']def max_word...

2019-04-19 13:17:48 948

原创 kNN Python 机器学习算法代码实现

一、原理看最靠近自身的k个是什么，那自己就是什么。属于消极分类，不需要训练模型需要计算全局距离，当samples很大时很难使用（当然可以抽样）二、代码import numpy as npfrom sklearn.datasets import load_irisimport distance as diris = load_iris()data = iris.da...

2019-04-19 02:38:43 351

原创 Python 饼图

一、饼状图应用原理二、demosfrom sklearn.datasets import load_irisimport matplotlib.pyplot as pltimport numpy as npiris = load_iris()data = iris.datatarget = list(iris.target)import numpy as npimport...

2019-04-19 00:42:23 1346

原创盒装图

二、demosfrom sklearn.datasets import load_irisimport matplotlib.pyplot as pltimport numpy as npiris = load_iris()data = iris.datatarget = iris.targetdata[:, 0]# data = [data, d2, d2[::...

2019-04-18 22:03:04 679

原创 Python hist平面直方图

二、demosfrom sklearn.datasets import load_irisimport matplotlib.pyplot as pltimport numpy as npiris = load_iris()data = iris.datatarget = iris.targetprint(data[:, 0])print(target)num_bins...

2019-04-18 21:49:02 963

原创 Python 茎叶图

一、原理茎叶图又称“枝叶图”，它的思路是将数组中的数按位数进行比较，将数的大小基本不变或变化不大的位作为一个主干（茎），将变化大的位的数作为分枝（叶），列在主干的后面，这样就可以清楚地看到每个主干后面的几个数，每个数具体是多少。　　茎叶图有三列数：左边的一列数统计数，它是上（或下）向中心累积的值，中心的数（带括号）表示最多数组的个数；中间的一列表示茎，也就是变化不大的位数；右边的是数组中的...

2019-04-18 21:36:13 6707 1

转载 Python itertools包代码简洁小神器

Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数。首先，我们看看itertools提供的几个“无限”迭代器：>>> import itertools>>> natuals = itertools.count(1)>>> for n in natuals:... print n...12...

2019-04-18 21:15:40 334

转载 Sklearn datasets

作为Python中经典的机器学习模块，sklearn围绕着机器学习提供了很多可直接调用的机器学习算法以及很多经典的数据集，本文就对sklearn中专门用来得到已有或自定义数据集的datasets模块进行详细介绍；datasets中的数据集分为很多种，本文介绍几类常用的数据集生成方法，本文总结的所有内容你都可以在sklearn的官网：http://scikit-learn.org/stabl...

2019-04-17 03:24:40 405 1

原创 DBSCAN代码实现 Python（未完成）

一1.DBSCAN密度聚类简介DBSCAN 算法是一种基于密度的聚类算法：　　1.聚类的时候不需要预先指定簇的个数　　2.最终的簇的个数不确定DBSCAN算法将数据点分为三类：　　1.核心点：在半径Eps内含有超过MinPts数目的点。　　2.边界点：在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内的点。　　3.噪音点：既不是核心点也不是边界点的点。如下图所示...

2019-04-17 03:14:55 643

转载 Numpy 切片

ndarray对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样。ndarray 数组可以基于 0 - n 的下标进行索引，切片对象可以通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。实例import numpy as np a = np.arange(10) s = slice(2...

2019-04-17 03:04:44 353

转载 Numpy 符号函数

1、numpy.mod()numpy.mod() 计算输入数组中相应元素的相除后的余数。函数 numpy.remainder() 也产生相同的结果。实例import numpy as np a = np.array([10,20,30]) b = np.array([3,5,7]) print ('第一个数组：') print (a) print ('\n') print ('第二个...

2019-04-17 03:03:21 1538

转载 Numpy 索引排序

numpy.argmax() 和 numpy.argmin()numpy.argmax() 和 numpy.argmin()函数分别沿给定轴返回最大和最小元素的索引。实例numpy.sort()numpy.sort() 函数返回输入数组的排序副本。函数格式如下：numpy.sort(a, axis, kind, order)参数说明：a: 要排序的数组 axi...

2019-04-17 02:57:31 4831

转载 Numpy 创建数组

numpy.zeros创建指定大小的数组，数组元素以 0 来填充：numpy.zeros(shape, dtype = float, order = 'C')参数说明：参数描述 shape 数组形状 dtype 数据类型，可选 order 'C' 用于 C 的行数组，或者 'F' 用于 FORTRAN 的列数组实例import nu...

2019-04-17 02:40:52 2389

转载 matplotlib命令与格式：标题(title),标注(annotate),文字说明(text)

1.title设置图像标题(1)title常用参数fontsize设置字体大小，默认12，可选参数 ['xx-small', 'x-small', 'small', 'medium', 'large','x-large', 'xx-large']fontweight设置字体粗细，可选参数 ['light', 'normal', 'medium', 'semibold', 'bold', 'h...

2019-04-17 00:51:01 2690

转载广度优先遍历、深度优先遍历算法 python

广度优先遍历-bfs顾名思义，bfs总是先访问完同一层的结点，然后才继续访问下一层结点，它最有用的性质是可以遍历一次就生成中心结点到所遍历结点的最短路径，这一点在求无权图的最短路径时非常有用。广度优先遍历的核心思想非常简单，用python实现起来也就十来行代码。下面就是超精简的实现，用来理解核心思想足够了：import Queuedef bfs(adj, start): vis...

2019-04-17 00:38:53 641

转载 Matplotlib 线型属性

2019-04-16 19:47:49 605

转载 Numpy random 模块

numpy.random模块中提供啦大量的随机数相关的函数。1 numpy中产生随机数的方法　　1)rand() 　　产生[0,1]的浮点随机数,括号里面的参数可以指定产生数组的形状　　2)randn()　　产生标准正太分布随机数，参数含义与random相同　　3)randint()　　产生指定范围的随机数，最后一个参数是元祖，他确定数组的形状 1 2 3...

2019-04-16 17:51:32 316

原创 K均值算法

一、原理二、Python实现import matplotlibimport matplotlib.pyplot as pltimport numpy as np# Data for plottingdef createdata(): np.random.seed(0) data0 = np.random.rand(2, 100) ...

2019-04-14 23:54:51 813

转载一问搞懂python的init和new方法

一、文字概述__new__是在实例创建之前被调用的，因为它的任务就是创建实例然后返回该实例，是个静态方法。__init__是当实例对象创建完成后被调用的，然后设置对象属性的一些初始值。故而“ 本质上 ”来说，__new__（）方法负责创建实例，而__init__()仅仅是负责实例属性相关的初始化而已，执行顺序是，先new后init。二、new和init的执行顺序1、当定义类的时候，...

2019-04-14 00:34:16 223

YZXnuaa的博客