自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 矩阵与线性代数(二)

(上一篇文章从向量与空间的角度介绍了矩阵,本文从线性变换的角度来做一些介绍。)一、简介矩阵也以看成是描述线性变换,严格来说,需要用方阵表示,即行数和列数一致的矩阵。因为线性变换是在一个空间中进行的。此处需要说明的是,方阵也可以看成是向量空间,同一般的矩阵一样,但是非方阵就不能看成是线性变换。关于线性变换,就是将n维空间中的向量或者子空间变成另一个向量或者子空间。这个操作可以表示成nn的矩阵,...

2019-06-02 17:12:33 773

原创 矩阵与线性代数

矩阵是线性代数的研究对象,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合 ,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。抽象理解矩阵,是理解高等数学的基础。一般来说,矩阵指代下面两种含义之一,当然,这两种含义并非割裂开的,正是由向量的运动(线性变换)组成了空间。1、 向量空间2、 线性变换一、 向量空间。向量空间直观来看,是由向量组成的...

2019-04-18 16:48:06 3992

原创 F分布及其应用

F分布是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。它是一种非对称分布,有两个自由度,且位置不可互换。设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)。其中n1称为第一自由度,n2称为第二自由度。由F分布的公式可知,1/F~ F...

2019-03-18 16:28:00 89537

原创 关于t分布

上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,...

2019-03-11 13:57:15 113869 1

原创 卡方分布

卡方分布是抽样分布的一种。抽样分布其实与概率论中的大数定律有密切的关系。当关注的对象的概率不可知,意味着只知道数据,不知道其内在规律;另一方面,关注的对象是可以分解成多种因素的组合时,就引入了抽样分布。抽样分布是描述从多个随机变量中抽取数据并且加以组合后,形成的规律。基本的抽样分布有三个:x^2(卡方)分布、F分布、t分布。本文介绍卡方分布。设随机变量X_1,X_2,⋯X_n相互独立,都服从N(...

2019-02-16 18:27:10 100504

原创 浅谈概率分布

“统计”一词在当下可以说是非常的流行,但是常常偏离了统计学的本意。如果能从统计学的基础上深入理解统计,并且再应用,应该更好。而要深谈统计学,就必须先理解概率论。概率论描述的是基础的,也可以说是理想的情况。本文从概率论里面常见的分布说起,简单的做介绍。概率分布包括了常听到的二项分布、正态分布等等。可将概率分布分成两类:离散分布(分布律)和连续分布(分布函数)。离散和连续是指随机变量的取值而说。随机...

2019-02-16 18:14:42 1444

原创 Numpy的理解与应用(三)

(本文接上文,为numpy中的线性代数部分。)三、 线性代数NumPy 中包含了一个矩阵库 numpy.matlib,该模块中的函数返回的是一个矩阵,而不仅是 ndarray 对象。NumPy 提供了线性代数函数库 linalg,该库包含了线性代数所需的所有功能。本文做一些简要说明。1、创建矩阵Matlib中可以用简单的语句建立一些基本的矩阵,例如单位矩阵,对角矩阵,0值矩阵,1值矩阵,随...

2019-01-28 17:45:54 186

原创 Numpy的理解与应用(二)

NumPy中的运算可以理解为三个部分:通用运算、数学运算、线性代数。下面将分别介绍。一、通用运算这部分有位运算和字符串运算。1、位运算NumPy中的位运算是基于对象的二进制来进行操作的,主要有以下函数:1)bin()函数和binary_repr()函数bin()函数返回一个数的真值:即包含符号的二进制;binary_repr()函数返回一个数的补码,可以调整宽度。由于计算机的运算是基于...

2019-01-28 17:07:19 186

原创 Numpy的理解与应用(结构、索引、切片、迭代)

NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy广泛用于以下任务:机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码方面)和快速(在速度方面)计算。NumPy数组用于存储训练数据和机器学习模型的参数。...

2019-01-19 18:53:14 434

原创 逻辑回归(一)

逻辑回归这个名字听起来与线性回归有一定的相似,因为有回归二字。实际上,逻辑回归与线性回归没有什么关系,逻辑回归是分类模型的一种,对于任意的(x_i,y_i), y_i的取值为(0,1)。本文主要从机器学习角度来阐述逻辑回归模型,有些地方会兼顾统计学。逻辑回归是用sigmoid函数将其值域压缩到0,1之间。逻辑回归的输出值是概率值(可以理解为特定事情的发生概率),可设定阈值将其分成两类,默认阈值是...

2019-01-05 16:47:20 563

原创 机器学习中回归模型的设计

一、背景在机器学习的范畴中,回归是放在监督学习模块中(机器学习分为:监督学习/非监督学习/半监督学习/深度学习)。简单来说,监督学习就是数据有标准的答案(标签),而算法的目的是在一定程度上展示其内在规律。这个内在规律由于算法的不同和数据的不同有时候会有不同的表现,甚至我们的算法并不去找到这个规律,只是在认可其稳定存在的基础上,描述和预测数据。统计学相对机器学习,在展示数据规律这个目的上,表现的要...

2018-12-27 12:15:04 641

原创 统计回归模型的设计

这篇文章会从统计建模的方面来说明,机器学习方面的回归模型将放到之后。一、模型假设考虑模型如下Y=β_0+β_1X_1+β_2X_2+ε建立回归模型时,需要考虑数据是否满足以下六个条件。满足以下条件的数据才具有用回归模型模拟的意义,同时回归模型对于数据也才具备解释和预测的能力。指数分布族和广义线性回归(见上篇)可以保证线性回归模型的以下基本假设a、Y的平均值能够准确地被由X组成的线性函数...

2018-12-16 18:10:02 4029

原创 回归模型(背景和原理)

回归模型是做数据分析,统计建模和机器学习最先接触的模型,在大学读书的时候关注的就是计算过程,很多人在学习数学以及在数学基础上的研究,常常被复杂的公式所影响。有时候需要跳出来,看这些公式的目的,用途等,或许可以了解的更好。我准备从背景、数学原理、机器学习算法、python语言、模型解释和模型变化等方面来和大家交流回归模型。 **一、回归模型产生的背景** “回归”是由英国著名...

2018-12-09 18:23:28 23429 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除