自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(61)
  • 收藏
  • 关注

原创 机器学习的相关代码汇总

机器学习的相关代码汇总机器学习相关代码汇总XGBoost这个在sklearn当中有一个,但是有另一个功能更加强大的,只要pip3 install xgboost即可安装,不过这个安装过程真是一波三折的。然后,我们需要知道xgboost使用的大体流程,以下几个示例都没离开这个流程框架:示例1在这个示例里面,涉及到一个agaricus数据,这个单词意思是:巴西蘑菇。但是巴西蘑菇有很多种类,有的有毒,有的没有毒,能否预测出一个给定的蘑菇有毒还是没毒呢?import xgboost as xg

2021-05-08 12:53:12 3371 3

原创 机器学习(一)机器学习的流程以及部分概念简介

文章目录机器学习的流程以及部分概念简介step1.明确需求,具体要做什么务必要明确step2.首先得获取数据,数据的获取有如下途径:step3.对数据进行基本处理step4.特征工程(很重要)1.简介:2.相关步骤step5.找到合适的算法去进行预测1.数据1.1数据的类型1.2 数据的机构2.相关算法2.1监督与非监督学习2.2 分类与回归2.3 算法分类step6.对模型进行评估,并判断其是否管用step7.上线使用,往往是制作成api,供其他需要的部门,单位或者机构对接机器学习的流程以及部分概念简介

2021-04-18 15:57:46 1109

原创 Unity拓展——Project窗口拓展

Unity拓展——Project窗口拓展1 鼠标右键单击面板Project面板是用来存放整个工程文件信息的。这个窗口也是可以进行用户自定义拓展的。我们单击Project窗口空白的地方,就会弹出一个面板如下:我们再看看Unity菜单栏,打开Assets试一试:不难发现,二者具有高度一致性。因此,我们想要拓展这个面板,其实就跟拓展菜单栏方法几乎一模一样,只需如下即可:[MenuItem("Assets/ProjectTest1")]private static void ProjectTest1

2021-12-25 19:51:11 3988

原创 Unity拓展——菜单栏拓展

1. Unity菜单栏拓展当我们打开Unity的时候,我们可以直接看到在整个软件视图的最上方,有一个菜单栏如下图所示:实际上,除了默认给我们展示出来的,用户也可以自己根据自己的需要进行拓展。我们假设,要在现有拓展栏基础上,拓展出一个名为:MyFirstMenu的选项,下方有若干个复选项。该怎么做呢?1.1 基础显示首先,在Asset文件夹下(也就是整个工程文件的根节点下)创建一个Editor文件夹,在这个Editor文件夹下新建一个脚本,我们起名为:MyMenu.csusing System.C

2021-12-25 18:04:53 3071

原创 Lua的日期和时间

Lua的日期和时间1. os.time单纯的调用os.time()会返回一个时间戳,这个时间戳并不是我们日常使用的时间。所谓的时间戳,就是现在的时间距离1970年1月1日的秒数。print(os.time())--- 1635088147除此之外,os.time还支持反向转换day = { year = 2021, month = 10, day = 24, hour = 23, min = 8, sec = 22 }time = os.time(day)print(time)---

2021-10-25 23:45:58 1727

原创 Lua模式匹配

Lua模式匹配1. 字符串匹配string.find:用于在指定的目标字符串中搜索指定的模式。找到一个模式后,会返回两个值:匹配到模式开始位置的索引和结束位置的索引。如果没有找到任何匹配,则返回nil。s = "hello world"i,j = string.find(s,"hello")print(i,j) --- 1 5string.find具有两个可选参数。第3个参数是一个索引,用于说明从目标字符串的哪个位置开始搜索。第4个参数是一个布尔值,用于说明是否进行简单搜索(plain s

2021-10-16 23:53:33 757

原创 Python异常处理

Python异常处理文章目录Python异常处理一.前言二.错误VS异常1.错误2.异常三.常见的系统异常1.异常分类2. 系统异常的继承关系四.异常处理1. try-except-else语句2.try-finally3.raise语句五.自定义异常一.前言基本上各个语言都会有针对异常的处理。足以体现出异常处理的重要性。异常处理的重要性往往体现在了后期的维护上。对于开发者而言,如果一段代码有try-catch-finally这样的语句,那么在抛异常的时候,开发者就会很容易定位导致系统出bug的位置,

2021-07-04 22:05:45 141 5

原创 Python并发编程

Python并发编程文章目录Python并发编程一、前言1.为什么要搞并发编程2.增加运行速度的方法3.实现Python并发的方式3.1程序分类3.1.1 CPU密集型(CPU-bound)3.1.2 I/O密集型(I/O bound)3.2 多线程,多进行,多协程的对比3.3如何选择4.Python的全局解释器锁二、多进程编程1.进程创建步骤2.多进程演示3.获取进程编号4.一些要点5.Process()的常用方法6.进程池6.1 进程池简介6.2 进程池的相关方法6.3代码演示:7.进程通信7.1 Q

2021-07-03 23:41:50 349 5

原创 深度学习——RNN与LSTM简介

深度学习——RNN与LSTM文章目录深度学习——RNN与LSTM一.序列模型二. RNN1. 为什么用RNN2. RNN简介3. 双向RNN三.LSTM1. 一般RNN存在的问题2. LSTM简介2.1 LSTM单个单元是如何运作的?2.2 LSTM网络3. LSTM为什么能解决梯度问题?一.序列模型所谓的序列模型,是指:按照时间顺序,顺序发生的东西,这些东西,都可以统称为“序列模型”。比如说,我们听的音频,我们说的语言。对应到机器学习当中,可以是:音频生成,机器翻译,自然语言处理等等。这些模型都可以

2021-06-17 22:38:52 3828 2

原创 深度学习——Batch Norm简介

深度学习——Batch Norm文章目录深度学习——Batch Norm前言:为什么要正则化一.单一神经元的正则化二. Batch Norm前言:为什么要正则化关于这个问题,举一个生活上的例子。我们知道在工业生产的时候,只有标准化的,流水线的生产方式,效率才是高的。一个流水线上生产的产品,几乎都是一模一样的。为什么要这样?因为这样生产效率高。如果一个流水线上一会儿生产特斯拉,一会儿又生产法拉利,那么这个流水线光折腾不同的零件就够让人折腾了,谈何加快效率?在神经网络当中也是这样子,如果所有层的输入数据

2021-06-15 12:18:28 923

原创 TensorFlow—Keras常用API

TensorFlow—Keras常用API文章目录TensorFlow—Keras常用API前言一.模型自定义1. keras.Sequential2.keras.layers.Layer二.模型配置与训练1.compile2. fit三.模型预测四.模型评价五.模型保存与加载前言Keras当中的东西和神经网络的建立息息相关。当我们拿来一个神经网络模型的时候,我们会发现,无论是模型建立,模型的评估。都需要这个Keras。本来,Keras和TensorFlow并无什么瓜葛,但是在TensorFlow当

2021-06-13 23:18:09 1542 3

原创 反向传播补充

反向传播补充一.损失函数的梯度在机器学习以及深度学习当中,最常见的一种损失函数,就是最小二乘法损失函数,我们假设实际值是y,输出值呢,我们承接反向传播部分,是利用最后的Sigmoid函数或者Softmax函数输出的,我们记为:σ(z),z为线性方程\sigma(z), z为线性方程σ(z),z为线性方程在神经网络当中,损失函数是各个输出层的损失函数的累加,所以,整个神经网络的最小二乘损失函数就是:L=∑i=1nli=12∑i=1n(y−σ(z))2L = \sum_{i=1}^n l_{i}

2021-06-12 17:43:51 1237

原创 TensorFlow——合并分割、排序、限值

文章目录TensorFlow合并与分割tf.concattf.splittf.stacktf.unstackTensorFlow-张量排序tf.sort()与tf.argsort()tf.math.top_kTensorFlow-填充与复制tf.pad()tf.tileTensorFlow——张量限制值clip_by_valueclip_by_norm, clip_by_global_normTensorFlow合并与分割主要是4中方法,tf.concat, tf.split, tf.stack, t

2021-06-11 22:05:34 251 2

原创 TensorFlow——维度变换与Broadcasting

TensorFlow 维度变换文章目录TensorFlow 维度变换一.Reshape二.tf.transpose三.Squeeze和Expand_dimsBroadcasting前言Broadcasting核心思想Broadcasting有什么好处Broadcasting演示一.Reshape这个方法是numpy的方法。不再赘述,需要说明的是,reshape虽然应用起来非常灵活。但是会造成一些问题。比如说,一个28乘以14的图片,你一不小心,把长宽的参数给搞反了,那么很容易就出bug。而且,如果你

2021-06-10 16:00:03 181

原创 TensorFlow——索引与切片操作

TensorFlow 的索引与切片操作文章目录TensorFlow 的索引与切片操作一.基本切片操作二. TensorFlow 自带的切片方法2.1-tf.gather2.2-tf.gather_nd2.3-tf.boolean_mask一.基本切片操作首先,TensorFlow有最基本的切片操作,这个和许多高级语言的方式一样。同时,TensorFlow与Numpy语法也兼容。可以直接照搬Numpy的切片和索引操作。除了这些,TensorFlow也有其特有的切片方法。二. TensorFlow 自

2021-06-10 15:52:01 890

原创 TensorFlow基本数据类型简介

TensorFlow基本数据类型简介文章目录TensorFlow基本数据类型简介前言一.数据类型1.1 基本数据类型1.2 容器类型1.3 Tensor类型(张量)二.基本操作2.1 创建Tensor2.2 Tensor属性2.2 Tensor属性判别2.3 数据类型转换2.4 Variable类型前言事先说明一下:本文所用的是TensorFlow2.5.0版本。在TensorFlow2.0之后,TensorFlow的很多东西都做出了改变,与1.x版本已经有很多不同。整体来说,TensorFlow变得

2021-06-09 12:34:54 1597 3

原创 深度学习——卷积神经网络(CNN)简介

卷积神经网络简介文章目录卷积神经网络简介前言一.如何理解卷积1.1什么是卷积1.2 为什么要卷积二.神经网络的结构三.卷积层四.池化层五.全连接层六.数据训练前言卷积神经网络(Convolutional Neural Networks,简称:CNN)是深度学习当中一个非常重要的神经网络结构。它更多的是用在图像图片处理,视频处理,音频处理以及自然语言处理等等。早在上世纪80年代左右,卷积神经网络的概念就已经被提出来了。但其真正的崛起却是在21世纪之后,21世纪之后,随着深度学习理论的不断完善,同时,由

2021-06-07 00:21:39 31125 9

原创 深度学习——模型调整

模型调整文章目录模型调整前言一.学习率调整(Adaptive Learning Rate)二.提前停止(Early Stopping)三.正则化(Regularization)四.构建Activiation function五.DropOut前言在深度学习简介的3.3部分,给大家贴了一幅图:这幅图,很好的说明了模型调整的一个大致的框架。那么,具体怎么调整,其实在这幅图的左侧已经说明了。下面,我们就分别说一下这几个东西。一.学习率调整(Adaptive Learning Rate)这个,其实我们

2021-06-06 11:33:23 1994

原创 深度学习——反向传播(Backpropagation)

反向传播算法(Backpropagation)文章目录反向传播算法(Backpropagation)一.简介二.反向传播原理2.1 导数的链式法则2.2 正向传播与反向传播三.总结一.简介无论是机器学习,还是深度学习。都绕不开一个梯度下降。在进行深度学习简介的时候,我们有介绍过深度学习的大致步骤,分别为:构建神经网络数据拟合选出最佳模型其中,选出最佳模型的方式,其实就是利用梯度下降算法,选出损失函数最小的那个。在传统的机器学习当中,这个比较容易,直接算就行了。但是在深度学习当中,由于存在输

2021-06-05 23:36:00 30890 13

原创 深度学习简介

深度学习简介文章目录深度学习简介一.简介二.深度学习的核心——神经网络2.1什么是神经网络2.2 神经网络到底是怎么运作的?三.深度学习的步骤3.1 构建神经网络3.2 数据拟合3.3 选出最佳的模型一.简介经过了对传统的机器学习算法的一些学习之后,查了一些关于深度学习的资料。网上对于深度学习的概念往往比较抽象,难以理解。毕竟在现实当中,人工智能,机器学习,深度学习经常性的被人同时提及,这三个到底是什么关系?深度学习又是啥?关于这个问题,其实应该从人工智能开始说起。人工智能其实早在20世纪50年代就

2021-06-04 23:28:18 1913 3

原创 回归补充(三)梯度下降的改进

梯度下降的改进前言在学习梯度下降的时候,提及过梯度下降仍然存在很多缺点。在线性回归和梯度下降这篇文章当中,我们有在3.3部分说道:梯度下降,并不是没有缺点,比如说:当整个损失函数遇到了一个比较平缓的地方,那么这个地方的导数接近于0。而这个平缓的地方又不一定是极值点。那么就会造成停止下降,这样计算就有了偏差只能找到局部极值点,难以找到全局最小点。在鞍点(Saddle Point)处,梯度变化容易停滞正因为存在这些问题,所以才会针对这些个问题,提出若干方法。一.学习率预判这个在英文资料

2021-06-04 10:31:15 447

原创 Sklearn的一些技巧

Sklearn的一些技巧一、Sklearn调参以下是Jupyter notebook当中的截图,相关注释也已经注明,调参思路整体就是:固定住其他参数,利用for循环来动态遍历一下,看哪种效果比较好。(针对数据比较少的情况)二.能用knn来处理字符串类型吗?本身是不可以的,但是可以通过某些手段,把字符串和某些特定的数字映射一下,然后就可以用knn算法了。代码说明:np.argwhere(bool):找到符合括号内参数所描述的元素的索引(会把具体位置给返回)...

2021-05-25 20:35:54 184

原创 隐马尔可夫模型HMM

隐马尔可夫模型HMM一.简介我们之前学的很多模型,比如说线性回归模型,甚至包括与HMM有很强联系的朴素贝叶斯算法都有这样一个前提:样本之间默认是相互独立的。对于样本之间并不独立的情况,就比如说LDA模型应用的词分布,主题分布当中。一个文章的一个单词,和与这个单词紧挨着的词往往具有很强的关联性。在这个情况下,HMM的效果往往要更好一些。那么,这个HMM到底怎么理解呢?首先得先知道什么是马尔可夫模型马尔可夫模型(Markov Model)是通过寻找事物状态的规律对未来事物状态进行预测的概率模型,在马尔

2021-05-23 11:30:34 409

原创 主题模型

主题模型(Topic Model)文章目录主题模型(Topic Model)一.什么是主题模型二.主题模型要点1. Gamma函数2. 共轭先验3. 四个分布3.1 二项分布3.2 Beta分布3.3 多项式分布3.4 狄利克雷分布三.两个模型3.1 LDA模型(Latent Dirichlet Allocation)3.1.1 简介四.Gibbs采样4.1 简介4.2 词分布与主题分布一.什么是主题模型这个主题模型想要充分了解,首先得把朴素贝叶斯的很多东西都给搞明白,这部分的内容其实是相辅相成的。

2021-05-21 14:15:50 1520

原创 贝叶斯网络

贝叶斯网络文章目录贝叶斯网络一.朴素贝叶斯算法1.朴素贝叶斯的推导2. 高斯朴素贝叶斯3. 多项式分部朴素贝叶斯二. 贝叶斯网络1. 什么是贝叶斯网络2. 贝叶斯网络的应用一.朴素贝叶斯算法这个,之前有简介,在这个简介当中,已经介绍了条件概率公式,全概率公式,以及(朴素)贝叶斯公式。详细见:朴素贝叶斯算法但是需要补充一些知识点:1.朴素贝叶斯的推导在之前的简介中,只是介绍了朴素贝叶斯公式之后,就直接用这个公式就套进了文本分类问题当中。但,严格来说,朴素贝叶斯算法,其实有一个表达式:这个表达

2021-05-19 10:13:50 3467

原创 EM算法

EM算法文章目录EM算法一.高斯混合模型(GMM)1.GMM简介2.高斯函数的极大似然估计3. GMM的参数估计二. EM算法1.为什么会有EM算法2. EM算法内容三.EM应用于GMM(高斯混合模型)1. EM与GMM的关系2. EM理论公式推导GMM2.1 E-step2.2 M-step2. EM与K-means的联系X.相关数学知识点1. Jensen不等式一.高斯混合模型(GMM)1.GMM简介在之前的聚类算法当中,最为常用的算法是K-means算法,但是经典的聚类算法K-means也有它

2021-05-16 11:31:48 2160

原创 聚类算法简介

聚类一.什么是聚类1.聚类定义聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。由这个定义,我们便可以知道,数据集并没有目标值。因此聚类算法属于无监督算法。2. 相似度的衡量之前在k-means算法的简介当中,提及过一个欧式距离。但实际上,相似度的衡量方式有很多种。比如说:欧式距离(这里列出的是欧式距离的拓展,闵可夫斯基距离):杰卡德相似系数(Jaccard)余弦相似度:cos⁡(θ)=xTy∣x∣⋅∣

2021-05-12 15:18:46 6610

原创 SVM简介

SVMPPT3:核函数:有了核函数,SVM不仅仅可以处理回归问题,分类问题也可以解决。SMO:一种参数计算方法(这个大体了解,不重要)一. 什么是SVM1. 简介SVM,曾经是一个特别火爆的概念。它的中文名:支持向量机(Support Vector Machine, 简称SVM)。因为它红极一时,所以关于它的资料特别多,而且杂乱。虽然如此,只要把握住SVM的一些特点,至少可以做到思路清晰。首先,SVM是按照监督类学习方式进行运作的。即:数据当中含有目标值。SVM采用监督学习方式,对数据进

2021-05-09 16:17:20 38285 9

原创 提升算法介绍

提升算法一.什么是提升1. 偏差和方差我们给定一个数据D,自变量x对应的真实值为y(x),根据模型预测值的结果为为 hθ(x,D)h_{\theta}(x,D)hθ​(x,D)我们使用平方误差作为目标函数,则目标函数就是:ED[y(x)−hθ(x,D)]2E_{D}[y(x) - h_{\theta}(x,D)]^2ED​[y(x)−hθ​(x,D)]2我们把上一个式子进行拆解,就得到了方差和偏差。那么这两者有和区别呢?**偏差:**描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大

2021-05-07 11:00:11 1302 1

原创 决策树,随机森林补充(二)

决策树,随机森林补充(二)一. 如何评价一棵决策树1. 思想首先,我们先明确一些符号和概念。假定样本的总类别有K个。对于决策树的某叶结点,假定该叶结点含有样本数目为n。其中,第k类的样本点数目为nk (k=1,2,…,K)。我们先拿出两个极端情况:假如某类样为第j个样本本nj =n,而n1 ,…,n(j-1) ,n(j+1) ,…,nK =0,那么,我们称这个nj结点为纯结点;(说白了,只有一种类别)若各类样本数目n1 =n2 =…=nk =n/K,称该样本为均结点。(即:所有类别)

2021-05-04 21:54:33 538

原创 决策树、随机森林补充(一)

决策树、随机森林补充(一)文章目录决策树、随机森林补充(一)一.条件熵的推导二.经验熵、经验条件熵三.信息增益率,和Gini系数一.条件熵的推导条件熵的公式定义很简单:H(Y|X) = H(X,Y) – H(X)其中,H(X,Y)代表(X, Y)的联合熵。如果不理解这个,可以联想一下概率论当中的联合概率。条件熵表示:在X发生的前提下,Y发生“新”带来的熵。对于熵这个概念,看过电影《信条》的,大体都会知道,它表示混乱程度,熵越高,代表混乱程度或者不稳定程度越高。也就是说,如果他带来的熵越多,说明他带

2021-05-02 18:40:40 173

原创 回归补充(二)

回归补充(二)一. 线性回归的决定系数线性回归的决定系数,也叫:可决系数,也称测定系数,英文名:coefficient of determination。这个是用来测定拟合程度的。这个值越高,说明拟合程度越高。那么决定系数具体是什么呢?我们假设有m个样本,他们分别是(x1, y1), (x2, y2), (x3, y3), ……, (xm, ym)。这几个样本的估计值是(x1,y1^), (x2, y2^), ……(xm, ym)(yi上面有个,在这里不知道该怎么打这个符号了)。那么这几个样本一定

2021-05-01 22:58:07 310

原创 回归补充(一)

线性回归的一些补充一.如何用极大似然的原理来推最小二乘法我们知道,在线性回归回归当中,尽管你得出了一个线性回归函数,能够尽可能的和给出的训练数据相拟合。但是这个现行回归函数得出来的值,和实际值还是有一个误差的。因此,实际值我们就可以用下面这个公式表示,其中ε (i)表示误差。(公式1)值得一提的是,着当中的误差ε (i) (1≤i≤m)是独立同分布的,服从均值为0,方差为某定值σ^2 的高斯分布(也叫正态分布)。这个规律往往随着数据量的增大而越发的明显,哪怕这些独立同分布的数据本身并不一定服从正态

2021-04-29 20:42:41 407

原创 数据清洗

数据清洗文章目录数据清洗一.什么是数据清洗二.数据清洗的过程2.1 预处理2.2缺失值处理2.3 格式统一化2.4 修正逻辑错误2.5 去除不需要的数据2.6关联性验证一.什么是数据清洗我们在获得原始数据之后,并不是一股脑的把这些数据全都拿来使用,实际上,数据在整个机器学习阶段大致经历了这样一个流程:(原始数据–>数据清洗(形成特征)–>数据预处理–>特征工程–>进入到模型进行训练)为什么要经历这个流程?原因在于,最开始获得的原始数据,往往存在这样那样的问题,比如说有缺失值

2021-04-27 17:40:07 634

原创 机器学习(十五)零碎和总结

机器学习(十五)零碎和总结文章目录机器学习(十五)零碎和总结一.降维,分类,回归,聚类的使用情况二.模型的保存和导入三.线性回归与逻辑回归的对比四.阶段总结1.基本的一些名词和概念2. 特征工程3.监督学习4.非监督学习一些大体轮廓学完之后,有一些细小的知识点补充一下。顺便做一下阶段性的总结。一.降维,分类,回归,聚类的使用情况sklearn官方为我们画了一张图,很好的说明了这个问题。不难看出,什么时候使用什么样的算法,受到数据集大小的影响二.模型的保存和导入在实际工作当中,经常会遇到使用以前

2021-04-25 21:34:28 66

原创 k-means算法简介

机器学习(十四)k-means算法文章目录机器学习(十四)k-means算法一.什么是k-means二.k-means算法的步骤三.k-means性能评估指标四.k-means的使用4.1 相关API4.2 具体案例一.什么是k-means我们假设有这样一个场景。有一大堆硬币毫无任何规则的散落在那里,你事先并不知道这些硬币都是哪个国家的硬币。但是你却想按照国家对这些硬币进行分门别类。该怎么办?这个时候就需要k-means算法的支持。回到上述例子,我们首先事先并不知道有哪些类别的硬币,即:并不知道目标

2021-04-25 21:32:16 4615

原创 逻辑回归简介

机器学习(十三)逻辑回归一.什么是逻辑回归我们之前学习的线性回归,主要是应用在连续型数据上,也被称作:多重线性回归。在理解了多重现行线性回归的基础上,我们才能比较容易理解逻辑回归。两者有共同点,也有不同点。相同点:二者的模型形式基本上相同,以单变量为例,二者都具有 w*x+b这种形式不同点:多重线性回归直接将w*x+b作为因变量,即y =w*x+b,而逻辑回归则通过函数L将w*x+b对应到另一个状态p,即:p =L(w*x+b),然后根据p 与1-p的大小决定因变量的值。某些方面讲,

2021-04-25 21:29:22 1143

原创 岭回归

机器学习(十二)岭回归一.什么是岭回归之前,大体看了并了解了线性回归的东西,并在之后的学习中,大体直到了过拟合以及正则化的一些概念。需要指出的是:线性回归:Linearregression是很容易出现过拟合的。为了处理过拟合,岭回归就是一个很不错的选择。所谓岭回归,本质上就是一个带有正则化的线性回归。是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法。二.岭回归的使用在

2021-04-25 21:22:03 2134

原创 过拟合、欠拟合

机器学习(十一)过拟合、欠拟合一.欠拟合1.什么是欠拟合欠拟合还是比较容易理解的。对于一组数据集,如果你用于训练和测试的太少,那就说明学习的并不够。这样就无法不断的修正模型,比如说,之前在线性回归里面提到的权重W迭代的次数过少,那么自然而然,不能很好的预测房价。欠拟合的正式概念:假设在训练数据上不能获得更好的拟合, 但是在训练数据外的数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)2. 欠拟合的原因和解决办法原因:学习到数据的特征过少解决办法:增加数据的特征数

2021-04-25 21:21:15 170

原创 线性回归以及梯度下降

机器学习(十)线性回归一.什么是线性回归首先应该明确:线性回归是用来解决回归问题的。应用与连续型数据。比如说:房价的预测:根据现在手头的房价数据,我们大致就可以推出未来房价的大体走势投放广告的数量:一般来说,投放广告的数量和你挣了多少钱,也是有一定的线性关系的线性回归就是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。根据涉及到的变量的数量,我们大致可以把线性回归算法分为如下两个类别:一元线性回归:涉及到的变量只有一个多元线性回归:涉及到的变量

2021-04-25 21:20:07 751

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除