独家 | 线性代数:每个数据科学家的必知概念(下)

2bb9cb1bf4b6a97476c438b2dcc07400.png

作者:Benedict Neo
翻译:陈之炎
校对:ZRX

本文约2900字,建议阅读8分钟
本文将探讨上述线性代数概念、视觉解释和代码示例。

本文(上篇)目录

向量

  • 单位向量

向量操作

  • 向量相加

  • 标量相乘

  • 点积

向量空间

  • 零空间(核)

  • 张成空间

  • 线性独立

本文(下篇)目录

矩阵

  • 矩阵作为函数

  • 线性变换

  • 逆矩阵

  • 奇异矩阵

  • 单位矩阵

  • 对角矩阵 

  • 正交矩阵

  • 矩阵乘法

  • 决定值 

  • 特征向量和特征值

矩阵

矩阵是按行和列组织输入和操作方式。

5022d64e2b453c09369518ca035dab30.png

图片由作者提供

这是一个2行2列的矩阵,矩阵是一种数学工具,可以以结构化的方式解决实际问题。

矩阵作为函数

可以将矩阵视为函数,Python函数接收输入矩阵,经过处理之后返回输出矩阵, 矩阵变换通过线性变换将输入向量转换为输出向量。

62c19c01fd371995b5b075f672b92a91.png

图片由作者提供

线性变换

6bb305673afff4ef46576a5be78335bd.png

线性变换是在两个向量空间V和W之间的映射,它保留了向量加法和标量乘法的操作。将矩阵A应用于向量x以得到另一个向量y(通过操作Ax = y)是一种线性变换。这种变换在数据科学中得到大量使用:

  • 降维:PCA使用线性变换将高维数据映射到低维空间 

  • 数据转换:归一化或标准化数据集是一种线性变换

  • 特征工程:通过组合现有特征来创建新特征。

edb309ea057ad872d17a78ea70bcb3e1.png

1c20eddf0ad7c72619071043cec78b67.png

以下是一些特殊形式的矩阵:

逆矩阵

当矩阵与其逆矩阵相乘时,结果为单位矩阵。

02aa3affbc0be9d38dc530c9cb58f84c.png

奇异矩阵

奇异矩阵是没有一个逆矩阵的方阵,即矩阵的决定值为零或其秩小于其大小。

b319e596c22d4b6dbce6181c36836941.png

7b7d3c11deba47e558199653f44065d5.png

单位矩阵

单位矩阵是一个方阵,其对角线上的元素值为1,其余位置元素值为零,它在矩阵乘法中作为乘法恒等元素, 就像数字1一样,不改变矩阵中任何元素的值。

566d0fddc31038f1bf327f7943e87852.png

对角矩阵

对角矩阵是一个方阵,其中主对角线外的所有元素均为零,。它用于求解特征值, 并用于决定值计算。

1bf4f5aad344023b6a8745ce120cf93b.png

正交矩阵

211d42dee0881f18c8e80a59c2dd4ed5.png

如果一个方阵的转置等于它的逆阵,那么认为它是正交的。

正式地说,如果矩阵A满足 AᵀA=AAᵀ = I,其中I是单位矩阵,那么A就是正交的。

从几何意义上讲,如果一个矩阵的列和行是正交单位向量,即它们是相互垂直的并且大小为1, 那么该矩阵就是正交的。回想一下,如果两个向量互相垂直(90度),并且它们之间的点积为0,则它们就是正交的。

矩阵乘法

如何使用矩阵来执行矩阵乘法? 这里有一个很好的可视化图,摘自《线性代数直观指南》

e0d98775277195161d27fd488867e763.png

想象你正在对每个输入数据实施不同的操作。

169c46b3aab169baae49909af9c4010a.png

举个操作的例子。

b74d0d55c0802b7f1e68a632d5649b49.png

经过操作后,得到以下结果。

285f21229b53f41c4a6b8e6a1003e028.png

输入是一个[3 x 2] 矩阵,对输入实施操作的矩阵是 [2 x 3];结果是 [2 x 3] [3 x 2] = [2 x 2]。输入的大小必须与操作的大小相匹配。

ee880b6c96021755f9f0525b7d33f9a3.png

630613f3fb9c613387dcc16ba34d040d.png

d1da2a917492678c89d0b573411da350.png

矩阵的迹是其所有对角线元素的和,它在基变换下是不变的, 提供了关于矩阵的值信息,即,迹是矩阵的特征值之和。

1cf634e37a0274e40837b1f518f2d1a9.png

决定值

决定值是输出变换的大小, 如果输入是单位向量(面积或体积为1),那么决定值就是变换后的面积或体积的大小。 以下述矩阵为例,如果A的面积放大了6倍,那么变换的决定值就是6。 

bb1102fe69c6a321b02500793d22927f.png

负决定值意味着整个空间被翻转了,这种变换就像是把一堆纸翻转到另一边。

69daec4fa55a4c451855334d44a36e80.png

注意红色轴和绿色轴的方向是如何反转的,决定值为0意味着矩阵是“破坏性的”,并且无法逆转。类似于乘以零,信息丢失了。 决定值可以告诉我们矩阵是否可逆,如果det(A)是0,那么逆矩阵不存在;矩阵是奇异的。

e5ea4e75384248aec22b222869504726.png

矩阵中线性独立列/行向量的最大数量,它表示由其行或列张成的向量空间的维度,由此得出线性变换后的输出维度数量。当变换的输出是单一向量(它是一维的),说明变换的秩是1。如果所有向量都落在某个二维平面上,则说变换的秩是2。对于2x2矩阵来说,秩为2是它所能达到的最好情况,称之为满秩,它意味着基向量可以张成整个2D空间,并且决定值非零。 对于3x3矩阵来说,秩为2意味着它已经坍塌了,但还没有秩为1那么严重。

d1b59db74aa4fc0a479819af6fa6c748.png

5101a2317f3b4048655d705c66c5b33d.png

特征向量和特征值 

特征向量和特征值表示变换的“轴”。特征向量是在线性变换后方向不变的输入,即便方向没变,但是大小可能会变。 这个大小则是特征向量放大或缩小的程度,即特征值。 想象一下当旋转一个地球仪,每个位置都面向一个新的方向,但极点除外,极点的方向始终没有改变。

bab39cfea8f22145572b196cd5ecd01a.png

特征向量

对于矩阵A和向量v,如果Av = λv,那么λ是特征值,v是A的特征向量。还有一种说法是,方阵A的特征向量是满足矩阵乘法 = 标量乘法的向量。

96069158c4f51de3f57c59375676893a.png

7dd59020fce4c1ee6dd241e6d1a2ffc4.png

感谢拨冗阅读!

资源

Hackers 通道 

  • 程序员必学计算线性代数

  • 应用机器学习的线性代数入门

可视化

  • 图形线性代数-一种新的LA方法

  • 线性代数的本质3BluelBrown-惊人的动画,可视化的概念

  • 矢量化

  • 洞察数学

论文/课程/教科书

  • 深度学习所需的矩阵演算

  • 数据分析、信号处理和机器中的矩阵方法  |麻省理工学院开放式课程

  • 线性代数全答对

  • 4页线性代数.Pdf

保持联络!

务必关注 bitgrit 数据科学出版物以保持更新!想和其他数据科学家讨论数据科学和人工智能的最新发展吗?加入我们的discord服务器!关注 Bitgrit 以获取有关研讨会和即将到来的比赛的更新!

作者简介:

本博由 Benedict Neo 撰写 ,bitgrit 数据科学出版物的编辑,40K 关注, Python ∩ 数据科学 ∩ AI 

原文标题:

Linear Algebra Concepts Every Data Scientist Should Know

原文链接:

https://medium.com/bitgrit-data-science-publication/linear-algebra-concepts-every-data-scientist-should-know-18b00bd453dd

编辑:黄继彦

译者简介

1cd9b12c152d17f9fc248c154981c0ac.jpeg

陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

6ae78a3a1ef72e88f6e4747f7b4f9313.png

点击“阅读原文”拥抱组织

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值