《AI图像搜索引擎》笔记

最新推荐文章于 2025-03-12 19:18:05 发布

-野蛮更迭

最新推荐文章于 2025-03-12 19:18:05 发布

阅读量271

点赞数

文章标签：搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/construc/article/details/117065373

版权

《AI图像搜索引擎》笔记

第1章从文本搜索到图像搜索

1.1 文本搜索引擎的发展

1998年斯坦福学生Larry Page和Sergey Brin创立Google
PageRank算法极大提高了搜索结果相关性，几乎垄断了全球搜索引擎市场

1.2 文本搜索引擎的结构和实现

文本预处理 = 分词（标点+去停词） + 语言处理（Stemming/Lemmatization）
- 词干提取 eg. -tional -> -tion 词形还原 eg. reading -> read
建立索引 = 生成词典 + 词语排序 + 生成文档倒排表
- Node(Term, k) -> Node(Doc_1,freq_1) -> …… -> Node(Doc_k,freq_k)
搜索 = 合并链表 + 增删节点
相关性排序
$tf）:某一文档里的词频\\ 文档频率（Document Frequency, df）:包含词语的文档个数\\ 定义词语在文档中的权重:W_{t,d}=tf_{t,d}×log(\frac{n}{df_t})\\ 将查询语句也看作一个小的文档\\ \vec{q}=QryVector=(W_{q1},W_{q2},...,W_{qn})\\ \vec{d}=DocVector=(W_{d1},W_{d2},...,W_{dn})\\ Similarity(\vec{q},\vec{d})=cos(\vec{q},\vec{d})$

1.3 搜索引擎的一般结构

在这里插入图片描述

1.4 从文本到图像

人工标注索引；以图查图；神经网络算法；AlexNet以84.7%正确率在ImageNet夺冠

Google 百度 TinEye 淘宝

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。