自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 [一起面试AI]NO.10 什么是数据不平衡问题,应该如何解决

数据不平衡又称样本比例失衡,比如二分类问题,如果标签为1的样本占总数的99%,标签为0的样本占比1%则会导致判断「失误严重」,准确率虚高。常见的解决不平衡问题的方法如下。「数据采样」数据采样分为上采样和下采样,上采样是将少量的数据通过重复复制使得各类别比例均衡,不过很容易导致过拟合问题,所以需要在新生成的数据中加入随机扰动。下采样则相反,下采样是从多数类别中筛选出一部分从而使得各类别数...

2020-04-27 21:54:00 58

原创 python批量添加hexo文章封面

❝本文需要工具:「excel」「python3.x」❞今天突然觉得,我的博客的文章更新这么多了竟然还没有一个封面,觉得首页相当低调了…首页正好皮肤带有文章封面功能,所以我觉得要将文章批量加上文章推图!1.寻找图片推荐大家一个网站:https://www.pexels.com/找到你想要的页面:然后无脑ctrl+s….:按照类型分组然后将jpeg或者你想要的文件留下,全...

2020-04-19 16:40:08 518

原创 如何判断函数凸或非凸?

首先定义凸集,如果x,y属于某个集合M,并且所有的θx+(1-θ)f(y)也属于M,那么M为一个凸集。如果函数f的定义域是凸集,并且满足f(θx+(1-θ)y)≤θf(x)+(1-θ)f(y)则该函数为凸函数。如果函数存在二阶导并且为正,或者多元函数的Hessian矩阵半正定则均为凸函数。「注意」:中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Function...

2020-04-17 12:13:00 8435

原创 [一起面试AI]NO.9 如何判断函数凸或非凸

首先定义凸集,如果x,y属于某个集合M,并且所有的θx+(1-θ)f(y)也属于M,那么M为一个凸集。如果函数f的定义域是凸集,并且满足f(θx+(1-θ)y)≤θf(x)+(1-θ)f(y)则该函数为凸函数。如果函数存在二阶导并且为正,或者多元函数的Hessian矩阵半正定则均为凸函数。「注意」:中国大陆数学界某些机构关于函数凹凸性定义和国外的定义是相反的。Convex Functio...

2020-04-17 12:11:00 77

原创 [一起面试AI]NO.8 在机器学习中,常用的损失函数有哪些?

「(1) 0-1 loss」记录分类错误的次数。「(2)Hinge Loss」最常用在SVM中「最大优化间隔分类」中,对可能的输出t=±1和分类器分数y,预测值y的hinge loss定义如下:L(y)=max(0.1-t*y)「(3)Log Loss对数损失」对于「对数函数」,由于其具有「单调性」,在求最优化问题时,结果与原始目标一致,在含有乘积的目标函数中(如极大似然函数),通过...

2020-04-16 08:45:00 47

原创 机器学习中,常用的损失函数有哪些?

「(1) 0-1 loss」记录分类错误的次数。「(2)Hinge Loss」最常用在SVM中「最大优化间隔分类」中,对可能的输出t=±1和分类器分数y,预测值y的hinge loss定义如下:L(y)=max(0.1-t*y)「(3)Log Loss对数损失」对于「对数函数」,由于其具有「单调性」,在求最优化问题时,结果与原始目标一致,在含有乘积的目标函数中(如极大似然函数),通过「...

2020-04-16 08:44:13 1205

原创 常用梯度下降法与优化器都有什么?

机器学习中大部分为优化问题,而绝大部分优化问题都可以使用梯度下降法处理。梯度下降法的数学原理是函数沿着梯度方向具有最大变化率,那么在优化目标函数时沿着负梯度方向去减少函数值,以此达到优化目标。通过迭代的方式寻找最优参数,最优参数是指是目标函数达到最小值时的参数。如果目标函数是凸函数,那么梯度下降的解是全局最优解,不过在一般情况下,梯度下降无法保证全局最优。Q1 随机梯度下降与小批量随机梯度...

2020-04-15 09:15:06 620

原创 在机器学习中,偏差与方差是什么?

偏差度量了学习算法的期望与真实结果的偏差,刻画了算法本身的拟合能力,方差度量了同样大小的训练集的变动所导致的学习性能的变化。偏差用于描述模型的拟合能力,方差用来描述模型的稳定性。当训练度不足的时候,偏差主导模型的泛化误差;当训练进入后期,模型的拟合能力增强,方差主导模型的泛化误差;当训练足够的时候,如果拟合能力过强会导致过拟合。Q1 泛化误差、偏差、方差与噪声之间的关系学习器在训练集...

2020-04-15 09:14:29 772

原创 过拟合、欠拟合与正则化都是什么?

拟合与欠拟合的区别是什么,什么是正则化欠拟合指的是模型不能够再训练集上获得足够低的训练误差,往往由于特征维度过少,导致拟合的函数无法满足训练集,导致误差较大。过拟合指的是模型训练误差与测试误差之间差距过大;具体来说就是模型在训练集上训练过度,导致泛化能力过差。所有为了减少测试误差的策略统称为正则化方法,不过代价可能是增大训练误差。Q2 解决欠拟合的方法有哪些降低欠拟合风险主要有以下3类方...

2020-04-15 09:13:44 445

原创 特征降维主要包括什么?

主成分分析法(PCA)PCA是一个将数据变换到一个新的坐标系统中的线性变换,使得任何数据的投影的第一大方差在第一个坐标(第一主成分)上,第二大方差在第二个坐标(第二主成分)上,以此类推。其作用只要是为了让映射后得到的向量具有最大的不相关性。就是说PCA追求的是再将位置后能够最大化保持数据的内在信息。线性判别分析法(LDA)LDA是一种有监督的降维方法,主要是将高维的模式样本投影到最...

2020-04-15 09:13:01 1014

原创 特征选择主要包括什么?

特征选择是非常关键的步骤,选入大量的特征不仅会降低模型效果,也会耗费大量的计算时间,而漏选的特征也会直接影响到最终的模型结果。一般情况下主要利用以下办法进行特征选择。1.方差选择法假如某列特征变化一直很平缓,所以说明这组特征对预测结果影响不大,所以应该计算出各个特征的方差选择方差大于自身阈值的特征。2.相关系数,统计检验相关系数或者统计检验都可以用来特征选择。3.互信息法互信息法也经常...

2020-04-15 09:12:32 1187

原创 数据预处理主要包括什么?

无量纲化无量纲化主要解决数据的量纲不同的问题,使不同的数据转换到同一规格,常见的方法有标准化和区间缩放法。标准化的假设前提是特征值服从正态分布。区间放缩法利用了边界值信息,将特征的取值区间缩放到某个特点的范围,列如[0,1]等。(1) 标准化理论上,标准化适用于服从正态分布的数据,目前很多工程都依赖大数据,所以在样本足够多的情况下,工程师往往直接使用标准化对数据进行无量纲化预处理,在深度...

2020-04-15 09:11:55 10090

原创 分类问题常用的性能度量指标有哪些?

常用的性能度量指标有:精确率、召回率、F1、TPR、FPR。预测为真预测为假真实为真TP(true positive)FN(false negative)真实为假FP(false positive)TN(true negative)精确率Precision=TP/(TP+FP)召回率Recall=TP/(TP+FN)真正例率即为正例被判断为正例的概率...

2020-04-15 09:09:53 2528

原创 回归问题常用的性能度量指标有哪些?

1)均方误差:是反映估计值与被估计量之间差异程度的一种度量。2)RMSE均方根误差:观测值与真值偏差的平方和与观测次数m比值的平方根,用来衡量观测值同真值之间的偏差。3)SSE和方误差4)MAE:直接计算模型输出与真实值之间的平均绝对误差5)MAPE:不仅考虑预测值与真实值误差,还考虑了误差与真实值之间的比例。6)平均平方百分比误差7)决定系数人工智能更多面试问题...

2020-04-15 09:09:20 3681

原创 机器学习如何分类?

按照任务类型可分为:回归模型:例如预测明天的股价。分类模型:将样本分为两类或者多类。结构化学习模型:输出的不是向量而是其他结构。按照学习理论可分为:监督学习:学习的样本全部具有标签,训练网络得到一个最优模型。无监督学习:训练的样本全部无标签,例如聚类样本。半监督学习:训练样本部分有标签。强化学习:智能体与环境进行交互获得奖励来进行训练的一种模式,环境不会判断是否正确,而是会不...

2020-04-15 09:08:43 315

原创 什么是判别式和生成式模型?

按照任务类型可分为:回归模型:例如预测明天的股价。分类模型:将样本分为两类或者多类。结构化学习模型:输出的不是向量而是其他结构。按照学习理论可分为:监督学习:学习的样本全部具有标签,训练网络得到一个最优模型。无监督学习:训练的样本全部无标签,例如聚类样本。半监督学习:训练样本部分有标签。强化学习:智能体与环境进行交互获得奖励来进行训练的一种模式,环境不会判断是否正确,而是会不...

2020-04-15 08:59:29 285

原创 [一起面试AI]NO.7 常用梯度下降法与优化器都有什么?

常用梯度下降法与优化器机器学习中大部分为优化问题,而绝大部分优化问题都可以使用「梯度下降法」处理。梯度下降法的数学原理是函数沿着梯度方向具有「最大变化率」,那么在优化目标函数时沿着负梯度方向去减少函数值,以此达到优化目标。通过迭代的方式寻找「最优参数」,最优参数是指是目标函数达到最小值时的参数。如果目标函数是「凸函数」,那么梯度下降的解是「全局最优解」,不过在一般情况下,梯度下降无法保证...

2020-04-15 07:36:00 24

原创 [一起面试AI]NO.6 偏差与方差

偏差度量了学习算法的期望与真实结果的偏差,刻画了算法本身的「拟合能力」,方差度量了同样大小的训练集的变动所导致的学习性能的变化。偏差与方差偏差用于描述模型的拟合能力,方差用来描述模型的稳定性。当训练度不足的时候,偏差主导模型的泛化误差;当训练进入后期,模型的拟合能力增强,方差主导模型的泛化误差;当训练足够的时候,如果拟合能力过强会导致过拟合。Q1 泛化误差、偏差、方差与噪声之间的关系...

2020-04-14 07:53:00 36

原创 [一起面试AI]NO.5过拟合、欠拟合与正则化是什么?

Q1 过拟合与欠拟合的区别是什么,什么是正则化欠拟合指的是模型不能够再训练集上获得足够低的「训练误差」,往往由于特征维度过少,导致拟合的函数无法满足训练集,导致误差较大。过拟合指的是模型训练误差与测试误差之间差距过大;具体来说就是模型在训练集上训练过度,导致泛化能力过差。「所有为了减少测试误差的策略统称为正则化方法」,不过代价可能是增大训练误差。Q2 解决欠拟合的方法有哪些降低欠拟合风...

2020-04-13 20:02:00 26

原创 [一起面试AI]NO.4特征工程主要包括什么?

Q1 数据预处理主要包括什么「无量纲化」无量纲化主要解决数据的「量纲不同」的问题,使不同的数据转换到「同一」规格,常见的方法有「标准化」和「区间缩放法」。标准化的假设前提是特征值服从「正态分布」。区间放缩法利用了「边界值」信息,将特征的取值区间缩放到某个「特点」的范围,列如[0,1]等。(1) 标准化理论上,标准化适用于服从正态分布的数据,目前很多工程都依赖大数据,所以在样本「足够多」...

2020-04-13 11:09:00 21

原创 [一起面试AI]NO.3分类问题常用的性能度量指标有哪些

常用的性能度量指标有:「精确率」、「召回率」、「F1」、「TPR」、「FPR」。预测为真预测为假真实为真TP(true positive)FN(false negative)真实为假FP(false positive)TN(true negative)「精确率」Precision=TP/(TP+FP)「召回率」Recall=TP/(TP+FN)「真...

2020-04-13 11:07:00 44

原创 [一起面试AI]NO.2回归问题常用的性能度量指标有哪些

1)「均方误差」是反映估计值与被估计量之间差异程度的一种度量。2)「RMSE均方根误差」观测值与真值偏差的平方和与观测次数m比值的平方根,用来衡量观测值同真值之间的偏差。3)「SSE和方误差」4)「MAE」直接计算模型输出与真实值之间的平均绝对误差5)「MAPE」不仅考虑预测值与真实值误差,还考虑了误差与真实值之间的比例。6)「平均平方百分比误差」7)「决定系数」...

2020-04-13 11:06:00 30

原创 [一起面试AI]NO.1机器学习简介

Q1 机器学习如何分类按照任务类型可分为:「回归模型」:例如预测明天的股价。「分类模型」:将样本分为两类或者多类。「结构化学习模型」:输出的不是向量而是其他「结构。」按照学习理论可分为:「监督学习」:学习的样本「全部」具有标签,训练网络得到一个最优模型。「无监督学习」:训练的样本「全部」无标签,例如「聚类样本。」「半监督学习」:训练样本「部分」有标签。「强化学习」:智能体与环境进行交...

2020-04-13 10:59:00 26

原创 计算机网络学习笔记NO.2 物理层

2.1 基本概念2.1.1 物理层概念物理层解决如何在连接各种计算机的传输媒体上「传输数据比特流」,而不是指具体的传输媒体。物理层主要任务:确定与传输媒体「接口」有关的一些特性(定义标准)「机械特性」:定义物理连接的特性,规定物理连接时所采用的规格、接口形状、「引线数目、引脚数量」和排列情况。「电气特性」:规定传输二进制位时,线路上信号的「电压范围」、阻抗匹配、传输「速率」和「距离」...

2020-04-12 11:54:00 42

原创 运用python实现提取文章title重命名

最近整理文章,发现以前的post都是随便命名的如图:这不行啊,既不美观又不方便,所以我决定要将文件夹重命名。第一步:批量简易重命名因为我发现文件的命名毫无章法,所以第一步先全选然后F2,就可以一键改名了然后按一下enter:当然这样的文件还不能满足我们。我们新建一个xlsx,然后根据命名规则输入到A1里,然后点住右下角往下拖就好,然后将你想要命名的文件名输入到B里。第二步:提...

2020-04-11 18:22:00 50

原创 计算机网络学习笔记NO.1 计算机网络概述

第一节 计算机网络概念1.1.1组成·功能·分类网络包含计算机网络计算机网络:是一个将分散的、具有独立功能的「计算机系统」,通过「通信设备」与「线路」连接起来,由功能完善的软件实现资源共享和信息传递的系统。计算机网络是「互连」的,自治的计算机集合。❝互连-互联互通 通信链路自治-无主从关系❞计算机网络的功能1.数据通信(连通性)2.资源共享 (硬件 软件 数据)3.分布式处...

2020-04-03 11:24:00 32

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除