- 博客(13)
- 收藏
- 关注
原创 矩阵与线性代数(二)
(上一篇文章从向量与空间的角度介绍了矩阵,本文从线性变换的角度来做一些介绍。)一、简介矩阵也以看成是描述线性变换,严格来说,需要用方阵表示,即行数和列数一致的矩阵。因为线性变换是在一个空间中进行的。此处需要说明的是,方阵也可以看成是向量空间,同一般的矩阵一样,但是非方阵就不能看成是线性变换。关于线性变换,就是将n维空间中的向量或者子空间变成另一个向量或者子空间。这个操作可以表示成nn的矩阵,...
2019-06-02 17:12:33
773
原创 矩阵与线性代数
矩阵是线性代数的研究对象,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合 ,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。抽象理解矩阵,是理解高等数学的基础。一般来说,矩阵指代下面两种含义之一,当然,这两种含义并非割裂开的,正是由向量的运动(线性变换)组成了空间。1、 向量空间2、 线性变换一、 向量空间。向量空间直观来看,是由向量组成的...
2019-04-18 16:48:06
3992
原创 F分布及其应用
F分布是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。它是一种非对称分布,有两个自由度,且位置不可互换。设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)。其中n1称为第一自由度,n2称为第二自由度。由F分布的公式可知,1/F~ F...
2019-03-18 16:28:00
89537
原创 关于t分布
上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,...
2019-03-11 13:57:15
113869
1
原创 卡方分布
卡方分布是抽样分布的一种。抽样分布其实与概率论中的大数定律有密切的关系。当关注的对象的概率不可知,意味着只知道数据,不知道其内在规律;另一方面,关注的对象是可以分解成多种因素的组合时,就引入了抽样分布。抽样分布是描述从多个随机变量中抽取数据并且加以组合后,形成的规律。基本的抽样分布有三个:x^2(卡方)分布、F分布、t分布。本文介绍卡方分布。设随机变量X_1,X_2,⋯X_n相互独立,都服从N(...
2019-02-16 18:27:10
100504
原创 浅谈概率分布
“统计”一词在当下可以说是非常的流行,但是常常偏离了统计学的本意。如果能从统计学的基础上深入理解统计,并且再应用,应该更好。而要深谈统计学,就必须先理解概率论。概率论描述的是基础的,也可以说是理想的情况。本文从概率论里面常见的分布说起,简单的做介绍。概率分布包括了常听到的二项分布、正态分布等等。可将概率分布分成两类:离散分布(分布律)和连续分布(分布函数)。离散和连续是指随机变量的取值而说。随机...
2019-02-16 18:14:42
1444
原创 Numpy的理解与应用(三)
(本文接上文,为numpy中的线性代数部分。)三、 线性代数NumPy 中包含了一个矩阵库 numpy.matlib,该模块中的函数返回的是一个矩阵,而不仅是 ndarray 对象。NumPy 提供了线性代数函数库 linalg,该库包含了线性代数所需的所有功能。本文做一些简要说明。1、创建矩阵Matlib中可以用简单的语句建立一些基本的矩阵,例如单位矩阵,对角矩阵,0值矩阵,1值矩阵,随...
2019-01-28 17:45:54
186
原创 Numpy的理解与应用(二)
NumPy中的运算可以理解为三个部分:通用运算、数学运算、线性代数。下面将分别介绍。一、通用运算这部分有位运算和字符串运算。1、位运算NumPy中的位运算是基于对象的二进制来进行操作的,主要有以下函数:1)bin()函数和binary_repr()函数bin()函数返回一个数的真值:即包含符号的二进制;binary_repr()函数返回一个数的补码,可以调整宽度。由于计算机的运算是基于...
2019-01-28 17:07:19
186
原创 Numpy的理解与应用(结构、索引、切片、迭代)
NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy广泛用于以下任务:机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码方面)和快速(在速度方面)计算。NumPy数组用于存储训练数据和机器学习模型的参数。...
2019-01-19 18:53:14
434
原创 逻辑回归(一)
逻辑回归这个名字听起来与线性回归有一定的相似,因为有回归二字。实际上,逻辑回归与线性回归没有什么关系,逻辑回归是分类模型的一种,对于任意的(x_i,y_i), y_i的取值为(0,1)。本文主要从机器学习角度来阐述逻辑回归模型,有些地方会兼顾统计学。逻辑回归是用sigmoid函数将其值域压缩到0,1之间。逻辑回归的输出值是概率值(可以理解为特定事情的发生概率),可设定阈值将其分成两类,默认阈值是...
2019-01-05 16:47:20
563
原创 机器学习中回归模型的设计
一、背景在机器学习的范畴中,回归是放在监督学习模块中(机器学习分为:监督学习/非监督学习/半监督学习/深度学习)。简单来说,监督学习就是数据有标准的答案(标签),而算法的目的是在一定程度上展示其内在规律。这个内在规律由于算法的不同和数据的不同有时候会有不同的表现,甚至我们的算法并不去找到这个规律,只是在认可其稳定存在的基础上,描述和预测数据。统计学相对机器学习,在展示数据规律这个目的上,表现的要...
2018-12-27 12:15:04
641
原创 统计回归模型的设计
这篇文章会从统计建模的方面来说明,机器学习方面的回归模型将放到之后。一、模型假设考虑模型如下Y=β_0+β_1X_1+β_2X_2+ε建立回归模型时,需要考虑数据是否满足以下六个条件。满足以下条件的数据才具有用回归模型模拟的意义,同时回归模型对于数据也才具备解释和预测的能力。指数分布族和广义线性回归(见上篇)可以保证线性回归模型的以下基本假设a、Y的平均值能够准确地被由X组成的线性函数...
2018-12-16 18:10:02
4029
原创 回归模型(背景和原理)
回归模型是做数据分析,统计建模和机器学习最先接触的模型,在大学读书的时候关注的就是计算过程,很多人在学习数学以及在数学基础上的研究,常常被复杂的公式所影响。有时候需要跳出来,看这些公式的目的,用途等,或许可以了解的更好。我准备从背景、数学原理、机器学习算法、python语言、模型解释和模型变化等方面来和大家交流回归模型。 **一、回归模型产生的背景** “回归”是由英国著名...
2018-12-09 18:23:28
23429
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人