向量间的距离和范数到线性空间、赋范空间、內积空间

参考:
https://baike.baidu.com/item/%E8%B5%8B%E8%8C%83%E7%A9%BA%E9%97%B4/2285667?fr=aladdin
http://blog.csdn.net/mr_hai_cn/article/details/53207307#reply
http://blog.csdn.net/soudog/article/details/2050632
https://www.zhihu.com/question/19967778

距离

首先我们给出距离的定义。以了解数学上关于距离抽象的定义。
这里写图片描述
如果满足上面的3个条件,我们就称d(x,y)是这两点之间的距离。
另外我们需要理解的是,距离度量的是一种长度,既然距离是长度的量化,那么度量的就有可能是直线也有可能是曲线,就像在地球仪上找2点距离,就需要画一个大圆,然后求弧长。

向量间距离

上面讨论的距离,只是一种高度概括抽象的距离的特性。这里给出其中常用的几种具体的向量间距离公式。情形1到情形3,分别是欧氏距离,棋盘距离,曼哈顿距离(也叫城市距离)。
这里写图片描述

向量范数

向量范数可以看成向量x=(x1,x2,…,xn)到零点的距离。
当我们这样理解范数的时候,那么对上面3种情形的距离公式,我们得到的对应的向量的范数就为:
这里写图片描述
我们会发现向量的范数与向量间的距离的公式很相似,即是其中的那个y向量为0时的情况。之所以所有的向量范数都以0向量为标准,是因为在线性空间中0向量是唯一不变的。

各种空间的关系

在我们继续展开讨论之前,我希望给出一个总括性的结论,让大家对数学上提出的各种空间的相互关系有一个总的认识。线性空间(向量空间)是一个比较初级的空间,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义了角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。这些空间都是线性空间
这里写图片描述
那么什么是完备性呢?
如果我们想研究收敛性(极限)怎么办?—定义完备性
简单的说就是空间在极限运算中,取极限不能跑出去。所以,显然有理数集,无理数集不具有完备性。实数集具有完备性。

各空间之间差别的简化展示

1.线性空间(向量空间)
线性空间又称作向量空间,关注的是向量的位置,对于一个线性空间,知道基(相当于三维空间中的坐标系)便可确定空间中元素的坐标(即位置);线性空间只定义了加法和数乘运算。
如果我们想知道向量的长度怎么办?—-定义范数,引入赋范线性空间
2.赋范线性空间定义了范数的线性空间!!
如果我们想知道向量的夹角怎么办?—-定义内积,引入内积空间
3.内积空间定义了内积的线性空间!!
4.欧式空间定义了内积的有限维实线性空间!!
如果我们想研究收敛性(极限)怎么办?—-定义完备
5.Banach空间完备的赋范线性空间!!!
6.Hilbert空间完备的内积空间!!!(极限运算中不能跑出度量的范围)

线性空间

线性空间又称作向量空间,关注的是向量的位置,对于一个线性空间,知道基(相当于三维空间中的坐标系)便可确定空间中元素的坐标(即位置);线性空间只定义了加法和数乘运算。
如果我们想知道向量的长度怎么办?—定义范数,引入赋范线性空间。即在线性空间中,我们是无法得出向量的长度的。

向量空间和线性空间的细微区别

线性空间和向量空间基本上是一个东西,但是线性空间中的元素可以是任何东西;在选定基以后可以表示成向量的形式,所以线性空间也叫向量空间。
具体来说,向量空间是狭义的,他的元素只能是向量。线性空间是广义的,他的元素可以任何东西,可以是向量,矩阵,多项式,函数……在线性空间选定了基以后就可以表示成向量的形式,这时2者就是同一个意思了。

线性空间的一些直观理解

摘抄于http://blog.csdn.net/soudog/article/details/2050632,感谢作者。
在线性空间中,当你选定一组基之后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描述该空间中的任何一个运动(变换)。而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量。
简而言之,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。或者我们也可以把矩阵理解为映射,一种变换函数,通过矩阵的乘法将原始点映射到想要映射的终点。
需要注意的是,上面的一句话中的运动并不是在说真正意义上的运动,即它所造成的结果(形成映射的终点)的过程并不会经过这个线性空间中的任何一个无关点,即不会形成路径到达终点。所以矩阵刻画对象的运动,用矩阵与向量的乘法施加运动改成矩阵是线性空间里跃迁的描述更为准确。

基是一组线性无关的內积为0的向量的集合。
直观地理解,选基就是找坐标系。

相似矩阵

若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系:
这里写图片描述
上面的公式也就是相似矩阵的定义公式。
从这里看,所谓的相似矩阵,就是同一个线性变换在不同基上的描述矩阵。也就是说一族相似矩阵都是对同一个线性变换在不同基下的描述。

赋范空间 (赋范线性空间)

首先给出百度百科上关于赋范空间的定义。
这里写图片描述
从上面的定义可以看出,赋范空间中添加了范数这一概念。所以导致添加了范数的线性空间形成了一个新的空间叫做赋范空间。因此赋范空间有向量的模长,即范数。也就是可以讨论长度了。但是还缺乏一个很重要的概念——两个向量的夹角,为了克服这一缺陷,我们引入了內积的概念。

內积空间

内积空间是增添了一个额外的结构的向量空间。这个额外的结构叫做内积,或标量积,或点积。这个增添的结构允许我们严格地讨论矢量的“夹角”和“长度”

  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
向量空间模型(Vector Space Model,VSM)是一种用于表示文本的数学模型,常用于信息检索和自然语言处理任务中。下面是一些使用向量空间模型的步骤: 1. 收集语料库:首先,你需要收集一组相关的文本数据,这些文本可以是文章、网页、问题和答案等。 2. 文本预处理:对文本进行预处理是必要的步骤,可以包括以下几个步骤: - 分词:将文本划分为单词或词组。 - 去除停用词:去除常见的无意义词语,如“的”、“是”等。 - 词干化或词形还原:将单词还原为其基本形式,如将“running”还原为“run”。 - 构建词汇表:建立一个包含所有文本中出现的单词的词汇表。 3. 特征提取:将文本转换为向量表示是向量空间模型的核心。常用的特征提取方法有: - 词袋模型(Bag-of-Words):将每个文本表示为一个向量,其中每个维度对应一个词汇表中的单词,数值表示该单词在文本中出现的频率或者权重。 - TF-IDF(Term Frequency-Inverse Document Frequency):通过计算单词在文本中的频率和在整个语料库中的逆文档频率来确定单词的权重。 - Word2Vec:将单词映射为低维向量表示,通过学习单词的上下文关系来捕捉语义信息。 4. 相似度计算:使用向量表示的文本可以计算文本之间的相似度。常用的相似度计算方法有: - 余弦相似度:计算两个向量之间的夹角余弦值,值越接近1表示越相似。 - 欧氏距离:计算两个向量之间的欧氏距离,值越小表示越相似。 5. 应用:使用向量空间模型可以进行多种文本相关任务,例如: - 文本检索:通过计算查询文本与语料库中文本的相似度,找到与查询相关的文本。 - 文本分类:使用文本的向量表示作为输入,训练分类模型进行文本分类任务。 - 文本聚类:将相似的文本聚集在一起,发现文本的分组或主题。 以上是向量空间模型的基本使用步骤,具体的实现可以根据具体任务和工具库进行调整。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值