![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Search Engine 笔记
文章平均质量分 77
cos2cot
这个作者很懒,什么都没留下…
展开
-
[笔记-0]写在最前+笔记大纲
0. 废话上这门课半学期了,从刚开始的一头雾水,到现在非常喜欢它,收获很大。教授是在这个领域很有经验,课程设计很合理,讲得也很有条理很清晰。Jamie人也超可爱的~打算最近把前半学期的内容按照Jamie给的系统示意图中的模块整理出来,避免考完了就还给他了…好啦,不多讲啦,开始正题~-------------------------------------------------原创 2017-10-20 09:35:48 · 380 阅读 · 0 评论 -
[笔记] Introduction to Shallow Language Processing
Bag of Words解释:搜素引擎用词袋模型这种shallow form理解语言。词袋模型的特征有:1)忽略word order;2)忽略stopwords(像the,a这种频率高又没什么实际意义的词);3)把words变成terms,将root相同的words变成一个term,比如cats->cat优缺点:pros:简单;有效c原创 2017-10-16 08:02:32 · 260 阅读 · 0 评论 -
[Search Engines笔记]17: Authority metrics
参考文档:[1] http://boston.lti.cs.cmu.edu/classes/11-642/[2] http://www.shuang0420.com/categories/NLP/Search-Engines/为啥要它?retrieval model大多只考虑page content的好坏,比如title url什么的,然而来自不同source的相似的con原创 2017-12-21 03:02:03 · 396 阅读 · 0 评论 -
[LC]3. Longest Substring Without Repeating Characters
一、问题描述Given a string, find the length of the longest substring without repeating characters.Examples:Given "abcabcbb", the answer is "abc", which the length is 3.Given "bbbbb", the ans原创 2017-12-21 06:31:12 · 126 阅读 · 0 评论 -
[Search Engines笔记] 16: Ranked retrieval: Feature-based models
参考文档:Jamie的课件:http://boston.lti.cs.cmu.edu/classes/11-642/阿衡的SE笔记:http://www.shuang0420.com/categories/NLP/Search-Engines/为啥要Learning to Rank: 我们已经学习了很多的检索方法: Retrieval Models:Vec原创 2017-12-19 08:14:37 · 483 阅读 · 0 评论