2020年08月_YEGE学AI算法

12月 11月 10月 09月 08月 07月 06月 05月

原创机器视觉基本理论（opencv）

1. 什么是图像采样采样是按照某种时间间隔或空间间隔，将空间上连续的图像变换成离散点的操作称为图像采样2. 什么是图像分变率采样得到的离散图像的尺寸称为图像分辨率。分辨率是数字图像可辨别的最小细节。分辨率由宽和高两个参数构成，宽表示水平反向的细节数，高表示垂直方向的细节数。3. 什么是RGB颜色空间RGB颜色空间中每个像素点有三个维度，分别记录在红、绿、篮三原色的分量上的亮度4. 什么是HSV颜色空间HSV颜色空间是另一种常用的计算机中表示颜色的方法。HSV表示色相、亮度和饱和度。H表示颜色

2020-08-20 20:06:32 1745

原创【机器学习与深度学习理论要点】26.请列举AlexNet的特点

请列举AlexNet的特点使用ReLU作为激活函数，并验证其效果在较深的网络超过了Sigmoid，成功解决了sigmoid在网络较深时梯度消失问题使用dropout（丢弃学习）随机忽略一部分神经元防止过拟合在CNN中使用重叠的最大池化，此前CNN中普遍使用平均池化，AlexNet全部使用最大池化，避免平均池化的模糊化效果提出了LRN（局部正规化）层，对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他神经反馈较小的神经元，增强了模型的泛化能力使用CUD

2020-08-20 17:49:10 304

原创【机器学习与深度学习理论要点】25.什么是归一化，为什么要进行归一化？

1）归一化是指归纳同意样本的统计分布性，归一化在0-1之间是统计概率分布，归一化在-1----+1之间是统计的坐标分布。2）归一化处理的目的为了后面数据处理方便，归一化可以避免一些不必要的数值问题。为了程序运行时收敛加快。统一量纲。样本数据的评价标准不一样，需要对其量纲化，统一评价标准。3）什么是批量归一化，其优点是什么？批量归一化是指在神经网络中间层也进行归一化处理，使训练效果更好的得到更好优点：减少了人为选择性参数。在某些情况下可以取消dropout和L2正则项参数，或者采取更小的

2020-08-19 20:24:56 3111

原创【机器学习与深度学习理论要点】24. 什么是卷积、池化，及卷积、池化的作用？

1）什么是卷积函数？卷积函数是指一个函数和另一个函数在某一个纬度上的加权“叠加”作用，其表达式为：s(t)=∫−∞+∞f(a)∗g(t−a)das(t) = \int ^{+\infty}_{-\infty}f(a)*g(t-a)das(t)=∫−∞+∞f(a)∗g(t−a)da离散化卷积函数表示为：s(t)=f(t)∗g(t)=∑n=−∞∞f(a)g(t−a)s(t) = f(t)*g(t) = \sum_{n=-\infty}^{\infty}f(a)g(t-a)s(t)=f(t)∗g

2020-08-19 20:23:59 543

原创【机器学习与深度学习理论要点】23. 什么是学习率，作用是什么，学习率导致的问题？什么是反向传播及反向传播算法

1）什么是学习率，作用是什么？在梯度下降法中，都是给定统一的学习率，整个优化过程中都以确定的步长进行更新，在迭代优化的前期中，学习率较大，则前进的步长就会较长，这时便能以较快的速度进行梯度下降，而在迭代优化后期，逐步减小学习率的值，减小步长，这样有助于算法的收敛，更容易接近最优解2）学习率过大或过小会导致什么问题学习率过大可能导致模型无法收敛，过小导致收敛速度过慢...

2020-08-19 19:04:45 1640 1

原创【机器学习与深度学习理论要点】22. 梯度，梯度下降，梯度消失问题，梯度爆炸问题，批量梯度下降、随机梯度下降的特点？

1、什么是梯度梯度是一个向量，表示某一函数在该点处的方向导数沿该方向取得最大值，即函数在该点处沿着该方向变化最快，变化率最大。2、什么是梯度下降梯度下降是一个最优化的算法，用来递归性地逼近最小偏差模型，核心思想是按照梯度相反的方向，不停地调整函数权值，步骤为：1）求损失函数值2）损失是否最够小，如果不是，计算损失函数的梯度3）按梯度的反方向走一小步（调整权重，wi=wi+δwiw_i = w_i + \delta w_iwi=wi+δwi)循环到第2步，迭代执行3、激活函数出现梯度

2020-08-16 16:50:42 525

原创【机器学习与深度学习理论要点】21. 损失函数及作用，交叉熵及作用？

1）什么是损失函数，损失函数的作用是什么？损失函数，用来度量预测值和实际值之间的差异，从而作为模型性能参考依据。损失值越小，说明预测输出和实际结果之间的差值就越小，也就说明我们构建的模型越好，反之说明模型越差。2）什么是交叉熵，其作用是什么？交叉熵主要用于度量两个概率分布之间的差异信息，在机器学习中用来作为分类问题的损失函数，当预测概率越接近真实概率，该函数值越小，反之越大。...

2020-08-16 15:44:57 663

原创【机器学习与深度学习理论要点】20. 什么是激活函数，为什么要用激活函数，常见的激活函数和特点，softmax函数

1）什么是激活函数，为什么要用激活函数？激活函数，指神经网络中将输入信号的总和转换为输出信号的函数，激活函数将多层感知机输出转换为非线性，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。2）神经网络中常用的激活函数有哪些，各自有什么特点？（1）sigmoid①定义：sigmoid函数用于影藏层神经元输出，能将数值映射到(0,1)区间，可用来做二分类，表达式为：f(x)=11+e−xf(x) = \frac{1}{1+e^{-x}}f(x)=1+e−x1②

2020-08-16 11:05:38 581

原创【机器学习与深度学习理论要点】19.前馈神经网络、深度学习的优缺点

1. 什么是前馈神经网络前馈神经网络又称多层感知机，是典型的深度学习模型。它是一种单向多层结构，其中每一层包含若干个神经元。在此种神经网络总，各神经元可以接收前一层神经元的信号，并产生输出到下一层。第0层叫输入层，最后一层叫输出层，其他中间层叫隐含层，隐含层可以是一层，也可以是多层。整个网络中无反馈，信号从输入层向输出层单向传播。f(x)=f(3)(f(2)(f(1)(x)))f(x) = f^{(3)}(f^{(2)}(f^{(1)}(x)))f(x)=f(3)(f(2)(f(1)(x)))其中

2020-08-16 11:04:22 2287

原创【机器学习与深度学习理论要点】18. 聚类问题

1. 基本概念1）什么是聚类问题聚类是指根据数据本身的特征，将样本按照相似度划分为不同的类簇，从而揭示样本之间内在的性质以及相互之间的联系规律。聚类属于无监督学习。2）好的聚类算法有哪些特征？良好的可伸缩性。不仅能在小数据集上拥有良好性能，得到较好聚类结果，而且在处理大数据集同时同样有较好的表现。处理不同类型数据的能力。不仅能够对数值型的数据进行聚类，也能够对诸如图像、文档、序列等复杂数据进行聚类，甚至在多种类型的混合数据集中有良好的表现。对样本顺序的不敏感性。良好的聚类算法应当不

2020-08-12 11:27:13 2588 1

原创【机器学习与深度学习理论要点】17. 决策树分类，支持向量机

决策树分类决策树分类和决策树回归思想基本相同，不同的是，决策树分类器输出为离散值。通过决策树进行分支处理，最后落到叶子节点上，使用投票的方式来决定预测结果属于哪个类别。支持向量机1）什么是支持向量机？支持向量机是一种二分类模型，它的目的是寻找一个超平面来对样本进行分割，分割的原则是间隔最大化。所谓“支持向量机”，就是下图中虚线穿过的边缘点。支持向量机就对应着能将数据正确划分并且间隔最大的直线。2）SVM寻找最优边界要求有哪些？正确性：对大部分样本都可以正确划分类别；安全性：支持向量，

2020-08-11 22:06:34 1266

原创【机器学习与深度学习理论要点】16. 什么是二元分类，朴素贝叶斯分类？

二元分类1）什么是二元分类？二元分类又称逻辑回归，是将一组样本划分到两个不同类别的分类方式。2）如何实现二元分类逻辑回归属于广义线性回归模型，使用线性模型计算函数值，在通过逻辑函数将联系值进行离散化处理。逻辑函数又称sigmoid函数，表达式为：y=11+e−ty = \frac{1} {1+e^{-t}}y=1+e−t1该函数能将(−∞,+∞)(-\infty,+\infty)(−∞,+∞)的值压缩到(0,1)区间，通过选取合适的阈值，转化为两个离散值(大于0.5为1，小于0.5为0)

2020-08-11 21:21:55 2220

原创【机器学习与深度学习理论要点】15. 什么是决策树？决策树的特点及使用情况

1）什么是决策树？决策树的核心思想是：相似的输入必然产生相似的输出。决策树通过把数据样本分配到树状结构的某个叶子节点来确定数据集中样本所属的分类。决策树可用于回归和分类。当用于回归时，预测结果为叶子节点所有样本的均值。2）决策树的特点①优点简单易懂，容易解释，可视化，适用性广。可用于分类、回归问题。②缺点容易过拟合。数据中的小变化会影响结果，不稳定。每一个节点的选择都是贪婪算法，不能保证全局最优解。3）什么情况下使用决策树？适合于标称型（在有限目标集中取值）属性较多的样本数

2020-08-10 00:29:30 2558

原创【机器学习与深度学习理论要点】14. 什么是多项式回归？多项式回归特点及使用情况

1）什么是多项式回归？多项式回归是指：根据样本数据，用高次多项式模型来最佳程度拟合样本的回归方法。多项式回归中，加入了特征的更高次方（例如平方项或立方项），也相当于增加了模型的自由度，用来捕获数据中非线性的变化。多项式回归模型一般表达式为：y=w0+w1x+w2x2+w3x3+...+wnxny = w_0 + w_1x + w_2x^2 + w_3x^3 + ... + w_nx^ny=w0+w1x+w2x2+w3x3+...+wnxn2）什么情况下使用多项式回归？在回归分析中有时会

2020-08-10 00:07:05 1696

原创【机器学习与深度学习理论要点】13. 什么是线性回归，线性回归特点及使用情况

1）什么是线性回归线性回归是指：通过数据样本，找到一个最佳拟合数据样本的线性模型，并用于预测。线性方程的一般表达形式为：y=w0+w1xy = w_0 + w_1xy=w0+w1x其中，x和y为已知，w0,w1w_0,w_1w0,w1是要经过学习获得的参数。2）什么情况下使用线性回归数据样本呈线性分布。在二维平面中，线性分布的特征是，数据呈一个狭长的条状分布，并且没有明显弯曲。已知模型为线性模型。3）线性回归的特点①优点思想简单，实现容易。建模迅速，对于小数据量、简单的关

2020-08-09 23:42:15 4914

原创【机器学习与深度学习理论要点】12.神经网络权重初始值如何设置？

在神经网络的学习中，权重的初始值特别重要。实际上，设定什么样的权重初始值，经常关系到神经网络的学习能否成功。1）权重初始值不能设置为0如果把权重初始值全部设为0，在误差反向传播法中，所有的权重值都会进行相同的更新，神经网络将无法正常学习。比如，在2层神经网络中，假设第1层和第2层的权重为0。这样一来，正向传播时，因为输入层的权重为0，所以第2层的神经元全部会被传递相同的值。第2层的神经元中全部输入相同的值，这意味着反向传播时第2层的权重全部都会进行相同的更新。因此，权重被更新为相同的值，并拥有了对称的值

2020-08-09 23:27:02 2096

原创【机器学习与深度学习理论要点】11.什么是L1、L2正则化？

机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，一般英文称作 L1-norm 和L2-norm，中文称作 L1正则化和 L2正则化，或者 L1范数和 L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项，所谓"惩罚"是指对损失函数中的某些参数做一些限制。范数的表达式为：∣∣x∣∣p=(∑∣xi∣p)1p||x||_p=(\sum|x_i|^p)^{\frac{1}{p}}∣∣x∣∣p=(∑∣xi∣p)p1当p=1时，是L1范数，其表示某个向量中所有元素绝

2020-08-08 23:58:13 196

原创【机器学习与深度学习理论要点】10.什么是置信概率、什么是交叉验证、解决类别不均衡问题？

1）什么是置信概率？置信概率是用来衡量推断结果的概率，该值越大说明推断结果确定性越大，该值越小说明推断结果不确定性越大。2）什么是交叉验证交叉验证指将含有N个样本的数据集，分成K份，每份N/K个样本。选择其中1份作为测试集，另外K-1份作为训练集，测试集就有K种情况。将K种情况下，模型的泛化误差取均值，得到模型最终的泛华误差。交叉验证的作用是为了得到更为稳健可靠的模型，对模型的泛化误差进行评估。...

2020-08-08 23:24:42 1374

原创【机器学习与深度学习理论要点】9.欠拟合与过拟合概念，及如何避免？

1）什么是欠拟合、过拟合？欠拟合指的是模型在训练和预测时表现都不好的情况。欠拟合：1. 模型复杂度不够2. 特征太少3. 模型层次太低过拟合是指模型对于训练数据拟合呈过当的情况，反映到评估指标上，就是模型在训练集上表现很好，但在测试集和新数据上表现较差。过拟合：1. 训练数量小2. 模型复杂度太高3. 模型层地太深4. 特征太多5. 参数值太大2）如何避免欠拟合？添加新特征。当特征不足或者现有特征与样本标签的相关性不强时，模型容易出现欠拟合。增加模型复杂度。简单模型的学习

2020-08-08 15:07:15 635

原创【机器学习与深度学习理论要点】8.超参数的概念、调优手段及对模型的影响？

1）什么是超参数?超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。2）超参数有哪些调优手段？①网格搜索网格搜索指查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的步长，网格搜索有很大概率找到全局最优值。然而，这种搜索方案十分消耗计算资源和时间，特别是需要调优的超参数比较多的时候。因此，在实际的应用中，网格搜索法一般会先试用较广的搜索范围和较大的步长，在寻找全局最优值可能的位置；然后回逐渐缩小搜索范围和步长，来寻找更精确的最优值。这种操作方案可以降低所需的时间

2020-08-08 10:17:31 2138 1

原创【机器学习与深度学习理论要点】07.A/B测试的概念及用法

1）什么是A/B测试?A/B测试就是两种模型同时运行，并在实际环境中验证其效果的方式。在互联网公司中，A/B测试是验证新模块、新功能、新产品是否有效，新算法、新模型的效果是否有提升，新设计是否收到用户欢迎，新更改是否影响用户体验的主要测试方法。在机器学习领域中，A/B测试是验证模型最终效果的主要手段。2）为什么需要A/B测试？离线评估无法完全消除模型过拟合的影响，因此，得出的离线评估结果无法完全替代线上评估结果。离线评估无法完全还原线上的工程环境。一般来讲，离线评估往往不会考虑线上环境的延迟、数据

2020-08-08 09:54:20 648

原创【机器学习与深度学习理论要点】06.回归问题与分类问题模型评估指标有哪些？

1）回归问题模型评估指标？平均绝对误差：单个观察值与算数平均值的偏差的绝对值的平均。均方误差：单个样本到平均值差值的平方平均值。MAD(中位数绝对偏差)：与数据中值绝对偏差的中值。R2决定系数：趋向于1，模型越好；趋向于0，模型越差。2）分类问题模型评估指标？查准率：分类正确数量/（分类正确数量 + 多分类的数量），范围[0,1]。简单说来就是“分类对不对”。召回率：分类正确数量/（分类正确数量 + 少分类的数量），范围[0,1]。简单说来就是“分类全不全”。F1得分：2 * 查询率

2020-08-08 09:38:26 240

原创【机器学习与深度学习理论要点】05.监督学习，非监督学习概念及应用场景

1）什么是监督学习、非监督学习监督学习：使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签，训练一个预测模型，将输入数据映射到标签的过程。非监督学习：在非监督学习中，数据并不被特别标识，适用于具有数据集但无标签的情况。学习模型是为了推断出数据的一些内在结构，如GAN2）监督学习、非监督学习主要应用场景监督学习：回归、分类非监督学习：聚类...

2020-08-08 00:48:28 2800 1

原创【机器学习与深度学习理论要点】04.训练数据不足带来的问题及解决方法？

1）在图像分类任务重，训练数据不足会带来什么问题？当训练数据不足时，说明模型从原始数据中获取的信息比较少，这种情况下要保证模型的效果，就需要更多鲜艳信息，具体到图像分类任务上。训练数据不足带来的问题主要表现在过拟合方面，即模型在训练样本上的效果可能不错，但在测试集上的泛华效果不佳。2）如果缓解数据量不足带来的问题?一定程度内的随机旋转、平移、裁剪、填充、左右翻转等，这些变换对应着同一个目标在不同角度的观察结果。对图像中的像素添加噪声干扰，比如椒盐噪声、高斯白噪声等。颜色变换。改变图像的亮度、

2020-08-08 00:40:14 2419

原创【机器学习与深度学习理论要点】03.特征归一化的概念、特点、方法及应用模型

1）什么是特征归一化对数值类型的特征做归一化，可以将所有的特征都统一到一个大致相同的数值区间内。2）为什么要特征归一化为了消除数据特征之间的量纲影响，使得不同指标之间有可比性。归一化后加快了梯度下降求最优解的速度。归一化有可能提高精度。3）特征归一化常用方法线性函数归一化：它对原始数据进行线性变换，使结果映射到[0,1]的范围，实现对原始数据的等比缩放。零均值归一化：它会讲原始数据映射到均值为0，标准差为1的分布上。4）归一化处理实用模型应用归一化的模型。在实际应用中，通过梯度

2020-08-08 00:15:14 443

原创【机器学习与深度学习理论要点】02.什么是激活函数，神经网络中常用的激活函数都有哪些，各自的特点？

激活函数：神经网络中将输入信号的总和转换为输出信号的函数，激活函数将多层感知机输出转换为非线性，使得神经网络可以任意逼近任何非线性函数，使神经网络可以应用到众多的非线性模型中。常用的激活函数及特点：1）sigmoid① 定义：sigmoid函数也叫Logistic函数，用于隐层神经元输出，能将(−∞,+∞)(-\infty,+\infty)(−∞,+∞)的数值映射到(0,1)的区间，可以用来做二分类。表达式为：f(x)=11+e−xf(x) = \frac{1}{1+e^{-x}}f(x)=1

2020-08-07 23:53:08 1217

原创【机器学习与深度学习理论要点】01.逻辑回归和线性回归区别与联系

区别：线性回归假设响应变量服从正态分布，逻辑回归假设响应变量服从伯努利分布线性回归优化的目标函数是均方差（最小二乘法)，而逻辑回归优化的是似然函数（交叉熵）线性回归要求自变量与因变量呈线性关系，而逻辑回归研究的是因变量取值的概率与自变量的概率逻辑回归处理的是分类问题，线性回归处理的是回归问题，这也导致了两个模型的取值范围不同：0-1和实数域联系：两个都是线性模型，线性回归是普通线性模型，逻辑回归是广义线性模型表达形式上，逻辑回归是线性回归套上了一个Sigmoid函数...

2020-08-07 23:25:52 977

原创第一章：PyTorch 入门

第一章：PyTorch 入门1.1 Pytorch 简介1.1.1 PyTorch的由来1.1.2 Torch是什么？1.1.3 重新介绍 PyTorch1.1.4 对比PyTorch和Tensorflow1.1.5 再次总结1.2 Pytorch环境搭建1.2.1 安装Pytorch1.2.2 配置 Jupyter Notebook1.2.3 测试1.2.4 问题解决问题1：启动python提示编码错误问题2 默认目录设置不起效1.3 PyTorch 深度学习:60分钟快速入门（官方）1. 张量PyTo

2020-08-04 16:43:22 368

原创 [Pytorch框架] PyTorch 中文手册

PyTorch 中文手册（pytorch handbook）书籍介绍这是一本开源的书籍，目标是帮助那些希望和使用PyTorch进行深度学习开发和研究的朋友快速入门。由于本人水平有限，在写此教程的时候参考了一些网上的资料，在这里对他们表示敬意，我会在每个引用中附上原文地址，方便大家参考。深度学习的技术在飞速的发展，同时PyTorch也在不断更新，且本人会逐步完善相关内容。版本说明由于PyTorch版本更迭，教程的版本会与PyTorch版本，保持一致。2020.1.16 PyTorch已经发布1.

2020-08-04 15:51:42 1977

深度学习02-03(图像处理、OpenCV实验案例)

深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)深度学习02-03(图像处理、OpenCV实验案例)

2020-07-17

数据分析中所有得资源文件

2020-06-29

StudentsPerformance.zip

项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件项目：分析影响学生成绩的因素的资源文件

2020-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

yegeli的博客