深度学习
文章平均质量分 86
无风听海
这个作者很懒,什么都没留下…
展开
-
支持向量机之松弛因子与线性支持向量机
一、线性支持向量机解决的问题线性可分支持向量机只支持线性可分的训练数据,通过硬间隔最大化实现分类数据;如果训练数据不是线性可分的,我们就需要使用线性支持向量机的方法,去除其中的一些异常点,从而实现剩余样本点的线性可分;相应于硬间隔最大化,它称为软间隔最大化;二、线性支持向量机的数学模型为了弥补某些线性不可分样本点的间隔不足的问题,我们为每个样本点引入松弛变量 ξi≥0\xi_{i} \geq 0ξi≥0,从而使得最终的间隔大于等于1故得到如下约束条件yi(w⋅xi+b)⩾1−ξiy_{i}\原创 2022-05-06 09:23:50 · 890 阅读 · 0 评论 -
从模型复杂度角度来理解过拟合现象
一、什么是模型复杂度机器学习是通过学习训练集的数据从而得到具体的模型,最终达到预测未知数据的能力;这就涉及到模型对训练数据的拟合能力了;从数理统计的角度来看,不同的训练数据集会有不同的概率分布规律;只有我们的模型的具有表达训练集的数据分布规律的能力才能训练得到一个好的模型,而模型的这个能力就是模型复杂度;二、从泰勒中值定理看模型复杂度对于一些比较复杂的函数,为了便于计算和研究,往往希望将其用一些简单的函数来近似表达。多项式是最为简单的一类函数,它只要对自变量进行有限次的加、减、乘三种算术运算,就能求出原创 2022-04-26 08:36:52 · 1165 阅读 · 0 评论 -
朴素贝叶斯算法
一、从生活角度来理解朴素贝叶斯算法朴素贝叶斯算法是统计学味道最浓的一款算法,也是最能体现我们日常生活经验的算法;与我们读万卷书行万里路形成我们自己的生活经验类似,朴素贝叶斯算法也是基于收集的历史数据分析得到相关事情发生的原因,从而形成解决问题的模型;与我们面对未知的未来类似,基于自己的生活经验计算各种可能的情况,最终选择一个最大可能的方向进行努力 ,朴素贝叶斯算法也是基于学习的模型计算给定的输入属于各个分类的概率,并选择概率最大的分类作为结果;从我们出生开始,就在不断的进行学习,通过上学、不同的人生原创 2022-04-12 09:13:02 · 1159 阅读 · 0 评论 -
决策树算法
决策树算法是一种通用的机器学习算法,既可以执行分类也可以执行回归任务,同时也是一种可以拟合复杂数据集的功能强大的算法;一、可视化决策树模型通过以下代码,我们使用iris数据集构建一个决策树模型,我们使用数据的后两个维度并设置决策树的最大深度为2,最后通过export出iris_tree.dot文件;DecisionTreeClassifier初始化中的random_state可以确保每次执行结果的不变性;from sklearn.datasets import load_irisfrom skle原创 2022-03-07 08:38:40 · 5371 阅读 · 0 评论 -
Tensorflow2对GPU内存的分配策略
一、问题源起从以下的异常堆栈可以看到是BLAS程序集初始化失败,可以看到是执行MatMul的时候发生的异常,基本可以断定可能数据集太大导致memory不够用了。2021-08-10 16:38:04.917501: E tensorflow/stream_executor/cuda/cuda_blas.cc:226] failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED2021-08-10 16:38:04.960048: E te原创 2021-08-10 20:56:03 · 1269 阅读 · 0 评论 -
数字图像基础
“图”是客观世界物体反射或透射光的分布,是客观世界的反映;而“像”则是人类视觉系统对图的响应,是人的大脑对图的印象或认识,是人的一种感觉。图像(image)是图和像的有机结合,既反映物体的客观存在,又体现人的感知因素。一幅图像可表示成一个范围有限二维空间内幅值有限的函数,其数学表达为:[插图]其中x,y表示图像中的空间坐标,I=f(x,y)表示图像某个位置的响应值,xstart和xend表示图像在水平方向上的边界,ystart和yend表示图像在垂直方向上的边界,Imin和Imax分别表示响应幅值的最小.原创 2021-04-24 23:04:01 · 1601 阅读 · 0 评论 -
机器学习开发流程基础
一、机器学习的四个分支前边我们已经学习了深度学习的分类问题,其目标是通过学习输入的训练数据和标签,来学习两者之间的关系,这是典型的监督学习。机器学习算法大致可以分为四类* 监督学习监督学习将输入的样本数据映射到标注的标记,是目前最常见的机器学习类型。目前广受关注的深度学习几乎都属于监督学习,例如光学字符识别、语音识别、图像分类、语言翻译。监督学习主要包括分类和回归,但是有很多变体,例如序列生成、语法树预测、目标检测、图像分割等。现实中的业务场景都是有明确的业务目标的,也就是错综复杂的原始数据,原创 2021-04-22 08:45:09 · 671 阅读 · 0 评论 -
深度学习之新闻多分类问题
平时除了遇到二分类问题,碰到最多的就是多分类问题,例如我们发布blogs时候选择的tag等。如果每个样本只关联一个标签则是单标签多分类,如果每个样本可以关联多个样本,则是多标签多分类。今天我们来看下新闻的多分类问题。一、数据集这里使用路透社在1986年发布的数据集,它包含很多的短新闻及其对应的主题,它包含46个主题,是一个简单的被广泛使用的分类数据集。 def load_data(self): return reuters.load_data(num_words=self.num原创 2021-04-15 22:12:33 · 648 阅读 · 0 评论 -
深度学习之电影二分类的情感问题
二分类问题可能是应用最广泛的机器学习问题。今天我们将学习根据电影评论的文字内容将其划分为正面或负面。一、数据集来源我们使用的是IMDB数据集,它包含来自互联网电影数据库(IMDB)的50000条严重两极分化的评论。为了避免模型过拟合只记住训练数据,我们将数据集分为用于训练的25000条评论与用于测试的25000条评论,训练集和测试集都包含50%的正面评论和50%的负面评论。与MNIST数据集一样,IMDB数据集也内置于Keras库。它已经过预处理:评论(单词序列)已经被转换为整数序列,其中每个整数代表原创 2021-04-13 22:12:05 · 452 阅读 · 0 评论 -
在Ubuntu上安装TensorFlow-GPU开发环境
深度学习是一个比较复杂的体系,今天记录一下开发环境的搭建步骤。全新安装Ubuntu 20.10,系统默认安装的是python3,查看python的版本;mango@ubuntu:~$ python3 --versionPython 3.8.6接下来我们安装pip3mango@ubuntu:~$ sudo apt-get updatemango@ubuntu:~$ sudo apt-get upgrademango@ubuntu:~$ sudo apt install pyt原创 2021-03-23 09:05:38 · 926 阅读 · 0 评论