June �-CSDN博客

原创 Time库--时间获取/格式化/程序计时应用

时间获取time库中时间获取的最主要的函数包括如下三个：time.time() - 获取系统当前时间戳，是一个表示从1970年1月1日0点0分开始计时的计算机内部时间值的浮点数；time.ctime() - 不仅能获取时间，还具有一定的可读性，返回的是一个字符串；time.gmtime() - 获取当前时间，生成的是计算机程序可以处理的时间格式（struct_time格式）举例如下：i...

2020-04-26 23:49:15 1439

原文链接：神经网络BP反向传播算法原理和详细推导流程1 反向传播算法和BP网络简介误差反向传播算法简称反向传播算法（即BP算法）。使用反向传播算法的多层感知器又称为BP神经网络。BP算法是一个迭代算法，它的基本思想为：（1）先计算每一层的状态和激活值，直到最后一层（即信号是前向传播的）；（2）计算每一层的误差，误差的计算过程是从最后一层向前推进的（这就是反向传播算法名字的由来）；（3）更新参...

2020-03-15 20:04:49 485

原创 Pandas数据的相关性分析

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。两个事物，表示成X和Y，如何判断他们之间的相关性？X增大，Y也增大，两个变量正相关；X增大，Y减小，两个变量负相关；X增大，Y没有明显变化，两个变量不相关；度量两个数据的相关性有以下方法：协方差...

2020-03-03 19:13:02 5088

原创 pandas的数据累计统计分析

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。数据的累计统计分析是能够对序列中的前n个数进行累计运算，对于一些大量的数据分析中，可以减少for循环的使用，也使得数据的运算变得更加灵活。pandas提供了一组数据累计统计分析函数，这些函数都适用于Series和DataFrame类型。.cumsum()依次给出前1，2，……，n个数的...

2020-03-03 08:24:35 2537

原创 pandas基本数据统计分析

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。pandas提供了一些数据统计分析的函数，这些函数使用于Series和DataFrame类型。函数名函数定义.sum()计算数据的总和，按照0轴计算，下同.count()非NaN的数量.mean() .median()计算数据的算术平均值，算数中位数...

2020-03-03 08:10:58 1795

原创 pandas数据的排序

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。在介绍数据排序之前，我们先对数据理解建立一个感性的认识，我们知道一组数据可以表达一个或者多个含义，我们需要一个完整的运算过程来得到数据的含义，我们把这个简单的运算过程称为摘要，摘要就是数据在形成特征的过程中采用有损的形式获得的一些结果，我们能够通过摘要获得以下信息：基本统计（含排序）分布/累...

2020-03-03 07:38:51 574

原创机器学习中的决策边界绘制

本文将会直接给出代码，主要目的在于对代码进行解释，熟悉使用python的Numpy和matplotlib库绘制决策边界曲线，代码来自于https://blog.csdn.net/dengjiaxing0321/article/details/70545740。代码如下import numpy as npfrom sklearn.datasets import make_moonsimpor...

2020-03-01 10:58:51 4059

原创 Pandas库的数据类型运算

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。算术运算法则算术运算根据行列索引，补齐后进行运算，不同索引之间不进行运算，运算默认产生浮点数；补齐时默认填充NaN（空值）；二维和一维，一维和零维（实数）进行广播运算；采用±*/符号进行的二元运算会产生新的对象；a = pd.DataFrame(np.arange(12).reshap...

2020-02-28 00:01:50 356

原创 Pandas的库的数据类型操作

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。改变Series和DataFrame对象。增加或重排：重新索引使用.reindex()能够改变或重排Series和DataFrame索引。d.reindex(index=['c5','c4','c3','c2','c1']) 城市环比同比定基c5 沈阳 100.5 120...

2020-02-27 23:02:20 276

原创 Pandas库的DataFrame类型

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。DataFrame类型由公用相同索引的一组列组成。DataFrame 的多列数据共用同一列索引，是一个表格型的数据类型，每列值的数据类型可以不相同；DataFrame既有行索引也有列索引，对于每一行的索引叫index，每一列的索引叫colum；DataFrame可以用于表达二维数据，同时也...

2020-02-27 19:56:22 476

原创 Pandas库的Series类型

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。Series的定义与创建Series类型由一组数据及与之相关的数据索引组成，Pandas特别强调数据和索引之间的关系，Series类型索引与数据之间一一对应。a = pd.Series([9,8,7,6])a0 91 82 73 6dtype: int6...

2020-02-26 23:55:31 613

原创 pandas介绍

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。pandas是python第三方库，是基于Numpy的一种工具，经常与numpy与matplotlib一起使用，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法...

2020-02-26 21:15:46 380

原创 pyplot直方图

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。直方图(Histogram)，又称质量分布图，是一种统计报告图，由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型，纵轴表示分布情况。pyplot种提供hist()函数绘制直方图。plt.hist(x, bins=None, range=None, density=...

2020-02-26 08:19:00 4437

原创 pyplot饼图的绘制

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。能够根据百分比展示数据功能的图表，对显示形式为百分数的数据具有很好的展示效果。使用matplotlib种的pie函数绘制饼图。x = [10,20,50,30]plt.pie(x)得到的会直接过如上图所示，需要为pie函数输入一个列表类型的数据，函数会将各数据值以百分数形式绘制称为饼状图...

2020-02-26 07:26:37 1309 1

原创 pyplot的基础图表函数

pyplot的基础图表函数函数说明plt.plot(x,y,fmt,……)绘制一个坐标图plt.boxplot(data,notch,position)绘制一个箱形图plt.bar(left,height,width,bottom)绘制一个条形图plt.bar(width,bottom,left,height)绘制一个横向条形图plt.pola...

2020-02-25 23:51:28 509

原创 pyplot的子绘图区域

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。我们知道如果需要在一个绘图区域中程多个绘图子区域，可以使用plt.subplot()方法，但是如果希望绘制如下图所示的相对复杂的绘图区域，那么就需要借助plt.subplot2grid()来辅助subplot来设计辅助子区域绘制。plt.subplot2grid(GridSpec,CurSp...

2020-02-23 11:45:36 1146

原创 pyplot的文本显示方法

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。文本显示常用函数plt.xlabel():对x轴增加文本标签；plt.ylabel():对y轴增加文本标签；plt.title():对图形整体增加文本标签；plt.text():在任意位置增加文本；plt.annotate():在图形中增加带箭头的注解；import matplotli...

2020-02-23 11:14:35 799

原创 plt.plot()

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。plt.plot(x,y,format_string,**kwargs)x:X轴上的数据，一般为列表或numpy中的数组，可选（只绘制一条曲线时，可省略，把y轴数据的索引值作为x取值）；y:Y轴上的数据，一般为列表或numpy中的数组；format_string:控制绘制曲线的格式字符串，可...

2020-02-23 10:02:03 1554

原创图像的数组表示和变换

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。图像的数组表示图像一般采用RGB色彩模式，图像中的每一个像素点，由红色，绿色和蓝色组成，这三种颜色形成三个颜色通道，每个通道之间进行变化和叠加之后形成各种颜色，其中R，G，B三个颜色通道取值范围均为0-255 ，叠加起来的色彩空间为256^3，RGB形成的颜色包括了人类视力所能感知的所有颜色。所...

2020-02-23 00:32:02 2143

原创梯度提升回归树（GBDT）

本文的主要内容是基于Python机器学习基础教程决策树部分进行整理和总结。模型描述梯度提升回归树和随机森林一样，是一种决策树集成方法，通过合并多个决策树来构建一个更为强大的模型。虽然名字中有“回归”，但是该方法既能用于回归问题，也能用于分类问题，与随机森林不同的是，梯度提升回归树（GBDT）采用连续的方式构造树，每棵树都在试图修正前一棵树的错误。默认情况下，梯度提升回归树没有随机化，而是用到了...

2020-02-21 23:46:14 6326

原创随机森林（random forest）模型原理及sklearn实现

本文的主要内容是基于Python机器学习基础教程决策树部分进行整理和总结。目的决策树的主要缺点在于，即使做了剪枝处理，也会出现过拟合的情况，泛化能力相对而言并不高，为此，在大多数的应用中，往往使用集成（ensemble）方法来代替单棵决策树。集成是合并多个机器学习模型来构建更强大模型的方法，目前已经证明随机森林（random forest）作为决策树集成方法对大量分类和回归的数据集都是有效的。...

2020-02-21 23:00:04 9684

原创 numpy的梯度函数np.gradient(f)

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。np.gradient(f):用于计算数组f中元素的梯度，当f为多维时，返回每个维度的梯度。a = np.random.randint(0,20,(5,))aarray([10, 0, 7, 0, 19])np.gradient(a)array([-10. , -1.5,...

2020-02-19 23:57:40 29050 4

原创 numpy的统计函数

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。常用统计函数（1）sum(a,axis=None):根据给定轴计算数组a的相关元素之和，axis整数或元组；mean(a,axis=None):根据给定轴计算数组a的相关元素的期望，axis整数或元组；average(a,axis=None,weights=None):根据给定轴计算数组a的...

2020-02-19 23:24:19 479

原创 Numpy的随机数函数

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。np.random的随机数函数numpy的random子库可以为数组提供随机数的相关功能，书写格式为mp.random.*(*为函数名城)下面介绍几个基本的随机数函数。rand(d0,d1,…,dn):根据d0-dn创建随机数数组，浮点数，（0，1），均匀分布；randn(d0,d1,…,d...

2020-02-19 22:44:15 441

原创 numpy多维数据存取

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。a.tofile()和np.fromfile()a.tofile(frame,sep=’’,format=’%s’)frame:文件或者字符串；sep:数据分割字符串，如果是空串，写入文件为二进制；format：写入文件的格式；a = np.arange(100).reshape(5,1...

2020-02-19 21:46:30 1553

原创数据的CSV文件存取

数据的CSV文件存取本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。CSV，Comma-Separated Value，逗号分隔符，CSV是一种常见的文件格式，用于存储批量数据，常用于存储一维和二维数据。如下表所示，存储称为CSV文件后变成用逗号分隔的数据文件。Numpy中有两个函数可以用来将文件写入CSV格式，并从CSV文件中读取数...

2020-02-19 20:30:36 638

原创 numpy及ndarray基础

前言Numpy是一个开源的Python科学计算基础库，也是目前Python用于科学计算和数据分析的最基础的第三方库，本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程ndarray的使用基础进行整理和总结。numpy简介Numpy提供了众多功能，主要包含如下：Numpy提供了一个非常强大的N维数组对象ndarray（数组）；提供一个具有广播功能的函数，...

2020-02-16 23:32:04 543

原创 np.squeeze()函数

语法与定义numpy.squeeze(a,axis = None)，其中：a:输入的数组；axis：需要删除的维度，但是指定的维度必须为单维度，否则将会报错（xis的取值可为None 或 int 或 tuple of ints, 可选。若axis为空，则删除所有单维度的条目）；会将运行结果已数组形式返回，并且不改变原数组。深度学习中的常见用途可以使用该函数将表示向量的数组转换为秩为...

2020-02-15 20:56:59 1856

MachineLearner的博客