自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

思维特二的博客

skleran之决策树

  • 博客(15)
  • 收藏
  • 关注

原创 函数的可微与可导

最近复习到高数的一元函数微分部分 ,可导和可微是两个特别重要也特别容易混淆的概念。所以简单记录一下,便于自己理解,仅供参考。导数从物理角度来说(牛顿是从物理学的角度发明出的微积分)某点的导数就是一个该点的瞬时变化率的问题。几何意义上来说(莱布尼茨从数学角度发明出的微积分),某点的导数是曲线在该点处的切线的斜率。从定义来看,导数在本质上是一个极限问题。f(x)在x0x_0x0​处的导数f(x)ˋ\grave{f(x)}f(x)ˋ​为:f(x)ˋ=lim⁡Δx→ 0f(x0+Δx)−f(x0

2021-01-27 20:20:41 6095

原创 对LSTM的简单理解

LSTM,长短期记忆(Long short-term memory是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题(关于梯度消失和梯度爆炸在上一篇集成学习里面有详细介绍)所以相比普通的RNN,LSTM在长的序列中有更好的表现。在学习LSTM之前我们需要了解什么是RNN循环神经网络?RNN循环神经网络和传统的卷积神经网络不同,CNN只能单独的取处理一个个的输入,前一个输入和后一个输入是完全没有关系的。但是,有时候我们需要能处理连续的序列数据。即前面的输入和后面的输入是有关系的。

2020-08-23 23:04:57 2476

原创 简析集成学习算法

集成学习在第一次写关于决策树的时候简单提到过,所以今天来更详细的总结一下。概念集成学习(ensemble learning)是时下非常流行的机器学习算法,本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型(称为基础模型或弱学习器)集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影,在各种算法竞赛中,随机森林,梯度提升树(GBDT),Xgboost等集成算法应用也很广。集成算法会考虑多个评估器的建模结果,得到一个综合的结果,以次达到比单个模型更好的回归或分类表现。组成集

2020-08-16 22:19:02 405 1

原创 Resnet残差网络

根据经验,网络层数的增加有利于模型训练的准确率 像上一次我们提到的VGG网络 就是通过增加网络深度来提取更丰富的特征越丰富,从而提高模型的训练精度和泛化能力。但是,当网络层数达到一定时不能单纯通过增加深度来优化网络,简单地增加深度,会导致梯度弥散或梯度爆炸。(反向传播时无法把有效地把梯度更新到前面的网络层,导致前面的层参数无法更新,因为层数越多,计算越复杂,传播到前面浅层次的梯度会越来越小,使浅层次的参数得不到很好的训练,模型训练起来也更加困难)。所以在Resnet出现之前,CNN网络都不超过二十几层。解

2020-08-09 22:46:13 2452

原创 浅谈生成对抗网络GAN

简介生成对抗网络(Generative adversarial networks)是深度学习领域的一个重要生成模型,还有其他的生成模型,比如VAE和其他GAN变种模型 。为什么叫做生成对抗网络。是因为GAN的主要结构包括一个生成器G(Generator)和一个判别器D(Discriminator)。下面以生产图片为例进行分析生成网络接收一个随机的噪音数据(一般服从正态分布),生生成图片,记作G(Z)。Z表示噪声数据。判别网络判断真实图像的输出结果输入为真实数据X,输出X为真实图片的概率(0

2020-08-02 22:52:55 705

原创 卷积神经网络之VGG模型

卷积神经网络CNN是我们深度学习过程中 的入门网络模型。它在视觉识别任务上的表现很好奇。一个复杂的CNN网络是带有上百万参数和许多隐含层的。AlexNet,VGG,Inception和ResNet是一些流行的CNN网络。那就接下来我们就从VGG说起吧。对于CNN模型,开始训练时我们可以使用一个很大的数据集如ImageNet(。CNN模型的两个特点:神经元间的权重共享和卷积层之间的稀疏连接。大部分的CNN模型都需要很大的内存和计算量,特别是在训练过程。要想尽可能的训练精度高,就要在计算量上增加。VGG模

2020-07-20 12:09:20 2223 1

原创 关于HTTP协议、万维网文档以及网络编程的基础梳理

http协议是应用层我们接触最多的一个协议,但当我们在浏览器中输出网址时,数据究竟是怎样在客户端和服务器端传输的呢?这需要我们了解http协议是怎样工作的。超文本传送协议HTTP协议就是规则,HTTP协议规定了怎样向万维网服务器请求文档,及服务器怎样把文档返回给浏览器。实际就是客户端和服务器端交互的一种通讯的格式。大致工作流程如下:每个万维网网点都有一个服务器进程,不断监听TCP的80端口,看是否有浏览器向他发出连接请求。浏览器发起请求连接, 服务器监听到连接请求后,接受该请求并建立TCP连

2020-06-21 19:01:25 1242

原创 对支持向量机SVM的简单理解

支持向量机svm1、概述支持向量机(SVM,也称为支持向量网络),是机器学习中常用算法之一,svm很强大,可实现的功能很多(在手写数字识别、人脸识别、文本分类、图像分类中应用广泛)。要深入理解svm的原理,需要掌握统计学理论基础。2、支持向量机分类器支持向量机的分类方法,是在一组数据分布中找出一个超平面作为决策边界,使模型在数据上的 分类误差尽量小,尤其是在未知数据集上的误差小,即模型泛化能力强。超平面超平面是一个空间的子空间,它是n维空间小一维的空间。 如果数据空间本身是三维的, 则其超平

2020-06-14 20:22:55 563

原创 哈希表和HashMap()深入理解

哈希表和hashmap()中关于hash()函数理解。概述哈希表又称散列表。基本思路是:把n个关键字为kik_iki​(i=1,2,3…n)的元素,根据关键字 kik_iki​ 在哈希函数上的映射,存到长度为 m 的连续内存单元中去,这样的线性存储结构为哈希表。哈希函数hash() :——以关键字kik_iki​为自变量,通过hash()映射到内存单元地址h(ki)h(k_i)h(ki​),即哈希地址为因变量,取值为(0-m-1)。,kik_iki​一般为元素的hashcode() 。问题:在

2020-06-03 19:36:45 1827

原创 一次搞懂什么是IP 子网掩码 默认网关 DNS

这里写自定义目录标题欢迎使用Markdown编辑器IP地址IP地址与MAC地址子网和子网掩码合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如

2020-05-30 20:36:37 1890

原创 常用排序算法的实现及分析

常用排序算法排序算法的实际应用场景很多,直接插入排序冒泡排序快速排序归并排序堆排序基数排序

2020-05-24 21:25:37 229

原创 对机器学习中的降维算法(PCA)的理解

PCA主成分分析什么是维度?在python中,对nump数组来说,维度就是.shape返回的结果,返回几个数字就是几维。对于DataFrame来说,一个DataFrame就是一张表,一张表最多二维(m行,n列)。其中m行是m个样本,n列是每一个样本所对应的n 个特征,该表就可以看作样本的特征矩阵。对每一张表来说,维度指的是样本数量m或者特征数量,(一般指的是特征数量n),因此可以简单地理解为有几个特征就是几维。降维算法中的“降维”(decomposition)指的就是降低特征矩阵中特征数量,从而降低算

2020-05-16 19:31:42 1898

原创 在使用malloc函数时遇见的常见错误

malloc函数简介malloc函数在C语言和C++中经常使用,为变量动态分配内存空间。函数原型 void malloc(int size)说明:malloc 向系统申请分配指定size个字节的内存空间。如果分配成功则返回指向被分配内存的指针,否则返回空指针NULL。该函数包含在头文件:#include <malloc.h>中 ,使用时需导入头文件*<malloc.h>或者<stdlib.h>** 。注意!当内存不再使用时,应使用free()函数将内存块释放。常

2020-05-10 18:17:58 12299

原创 浅谈贝叶斯分类

朴素贝叶斯算法中的原理简单理解及在sklearn中的代码实现机器学习中处处可见概率论、微积分、线性代数的知识,最近正好老师在上概率论,真正体会到了概率论的重要性,结合概率论知识可以更好的理解算法原理。原理简单介绍先要掌握几个基本概念:随机变量,联合概率,条件概率,独立性,贝叶斯公式。随机变量:样本空间在实数集R上的映射。常用大写字母X,Y表示。联合概率 P(AB)表示A和B都发生的概率。...

2020-05-03 20:15:00 1504

原创 对sklearn中决策树的理解

sklearn之决策树简介机器学习小白第一次写博客,这里就写一下最近在学习的,易快速上手的sklearn吧。sklearn入门scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。决策树决策树是一种有监督学习,从...

2020-04-24 21:12:02 349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除