线性代数在信息检索领域中的应用 (Application of Linear Algebra in Information Retrieval)

头一次发现线性代数在解线性方程组以外的应用,即线性代数在信息检索领域中的应用,在此记录一下。

假设数据库中有以下书籍。

B1. Applied Linear Algebra
B2. Elementary Linear Algebra
B3. Elementary Linear Algebra with Applications
B4. Linear Algebra and Its Applications
B5. Linear Algebra with Applications
B6. Matrix Algebra with Applications
B7. Matrix Theory

书名中出现的关键字(搜索时由用户输入)有:algebra,application,elementary,linear,matrix 和theory。

现在,要将每本书与关键字的匹配关系记录到一张表格(矩阵)中,如下所示:

Books       
Key WordsB1B2B3B4B5B6B7
algebra1111110
application1011110
elementary0110000
linear1111100
matrix0000011
theory0000001

1表示书名中包含对应的关键字,0表示不包含,即不匹配。

假设用户输入的关键字为algebra,application 和 linear,为了利用矩阵运算,将关键字保存为1维向量(7行1列矩阵,第一行到第七行分别对应B1到B7),如下所示:

  

Search Keywords
1
1
0
1
0
0

接下来,如何计算(统计)每本书与关键字列表的合计匹配次数呢?

很简单,只需要将Books表转置后与Search Kewords表进行矩阵乘法即可,如下所示:

transposed Books table      
Key Wordsalgebraapplicationelementarylinearmatrixtheory
B1110100
B2101100
B3111100
B4110100
B5110100
B6110010
B7000011

 

Hits
3
2
3
3
3
2
0

 Hits列即为各书与关键字的合计匹配次数(使用MMULT函数进行数组计算方式得到),即B1, B3, B4, B5中包含全部3个搜索关键字(algebra,application 和 linear)。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值