![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
港科大学习笔记
文章平均质量分 94
黄杨峻
这个作者很懒,什么都没留下…
展开
-
密码学速查笔记(一)-- 分组对称加密
一、定义区块加密Block Cipher,就是把大段的plaintext,分块加密传输。而One-key Block Cipher通常是以发送方和接收方共享一个Key作为加解密密钥。数学定义如下:One-key Block Cipher 是一个五元组 (M,C,K,Ek,Dk)(\mathcal{M,C,K},E_k,D_k)(M,C,K,Ek,Dk), 其中M\mathcal{M}M是原文文本空间,C\mathcal{C}C是加密文本空间,K\mathcal{K}K是键值空间所有键值k∈Kk原创 2021-12-12 12:45:42 · 921 阅读 · 0 评论 -
搜索引擎(一)-- Vector Space Model 和 倒排索引
一、向量空间模型1.1 布尔模型与统计学模型最早期的消息回溯模型是布尔模型(Boolean Model),这种模型将关键词用“与或非”连接成问答语句,譬如“DBMS AND Oracle AND NOT Sybase”,然后由系统返回Yes/No的回答。这种模型的构建和使用都相当简单,但它的缺点也很明显:布尔语句一旦变长,就会有很多层括号,读起来也很不方便。布尔模型很难控制回溯的文档数目。布尔模型是命中模型,且没有对文档中的关键词设置权重,无法对文档进行排名。布尔模型是完全匹配,不支持部分匹配原创 2021-12-09 22:10:08 · 818 阅读 · 0 评论 -
搜索引擎(二)-- 预测评价指标
文章目录一、简介二、二元检测评估指标2.1 精确率Precision & 召回率Recall2.2 PR曲线2.3 AUC-ROC2.4 平均精确率AP2.5 MAP2.5 综合评价指标三、连续值的评估指标3.1 NDCG一、简介评价一个搜索引擎,或者说信息回溯的系统的好坏,有许多指标。一般来说,我们会从召回速度和召回功效Effectiveness(准确与否)两个方面来评价。本文将着重基于后者评价一个搜索引擎的好与坏。回溯的准确与否可以是一个True or False的反馈,也可以是一个介于0-原创 2021-12-09 14:34:57 · 2655 阅读 · 0 评论 -
搜索引擎(三)-- PageRank和HITS算法
文章目录一、简介二、PageRank2.1计算公式2.1.1 原始PR算法2.1.2 Rank Sink问题与改良版PRPageRank矩阵表示三、HITS3.1 HITS计算四、其他应用4.1 引用矩阵Bibliometrics4.2 经济学一、简介要问搜索引擎是什么,很多人第一反应就是以百度,谷歌,雅虎为代表的搜索引擎。这些搜索引擎往往基于不同的算法,将分布于全球数百万机器上中最有价值的链接按价值的Ranking返回给查询者。长时间以来,网页搜索排名一直是互联网行业最具挑战的任务。本文将介绍几个典型原创 2021-12-07 18:35:55 · 1626 阅读 · 2 评论 -
搜索引擎(四)--相关反馈与个性化推荐
文章目录一、相关反馈的简介二、反馈种类三、查询优化3.1 优化流程3.2 具体方法已知相关文档集情况未知相关文档集情况四、文档权重优化4.1 机制4.2 实际问题一、相关反馈的简介相关反馈(Relevance Feedback)是某些信息检索系统的一个特征,用于评价被回溯(或者说检索)到的文章是否与需要的信息相关。有时用户只使用了一两个关键词用于检索,但我们很难弄清回溯结果是否符合用户需求。二、反馈种类显式反馈 Explicit Feedback来自用户对回溯文档是否相关的直接反馈,反馈通常为评分原创 2021-12-05 18:00:32 · 2192 阅读 · 0 评论 -
搜索引擎(六)-- 矩阵分解
文章目录一、引言二、奇异值分解SVD三、SVD的变种基于机器学习的SVD正则化因子Time SVDSVD++训练过程一、引言在搜索引擎(五)中我们提到了推荐系统中矩阵的稀疏问题,很多数据或者用户的交互数据过少,并且有部分交互数据也存在信息冗余的情况。因此,我们需要用矩阵降维的方法,将矩阵投射到对结果有影响的最重要的因素中,并基于此构建新的评价方法。除此以外,在此前提到的Memory-Based推荐里,我们常常也需要去评价物品或用户的相似度,这些物品或用户也有许多attributes,需要我们进一步进行原创 2021-12-04 21:27:45 · 858 阅读 · 0 评论 -
搜索引擎(五)--协同过滤
一、基本概念在搜索引擎中,推荐是一个重要的技术。从某种角度看,搜索本身就是一种推荐,搜索引擎通过算法(如PageRank,文档余弦相似度)召回排名最高的文档,并推荐给查询者。而一个推荐系统,希望尽可能返回少但精确的文档给它的使用者,所以,我们需要提出一种尽可能返回高价值文档的推荐算法,这个算法有可能基于内容,基于交互原创 2021-12-03 22:47:26 · 894 阅读 · 0 评论