![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
深森_Lemonade
这个作者很懒,什么都没留下…
展开
-
《数学之美》读书笔记(三):第11章~第15章
第十一章 如何确定网页和查询的相关性1.对搜索相关性贡献最大的是根据用户对常见搜索点击网页的结果得到的概率模型。2.影响搜索引擎的诸多因素:完备的索引;对网页质量的度量;用户偏好;确定一个网页和某个查询的相关性的方法。3.根据网页的长度,对关键词的次数进行归一化。4.度量网页和搜索的相关性,就一个简单的方法就是直接使用各个关键词在网页中出现的总词频。5.在度量相关性时不考虑停止词的频率。...原创 2019-03-14 09:55:43 · 400 阅读 · 0 评论 -
《数学之美》读书笔记(一):第1章~第5章
碎碎念:学信息论和语音信号处理的时候看了大半天课本也没看懂马尔可夫和隐马尔可夫到底是什么东西,考试也不考就直接跳过了,看了《数学之美》,没几页就看懂了马尔可夫,一本好书是多么重要啊。第一章 文字和语言vs数字和信息1.语言和数学的产生都是为了同一个目的——记录和传播信息。2.文字按照意思来聚类,会带来一些歧义性。有了上下文,大多数情况下多义字的去处歧义都可以做到。3.不同的文字系统在记录信...原创 2019-03-13 09:33:50 · 619 阅读 · 0 评论 -
《数学之美》读书笔记(二):第6章~第10章
第六章1.信息量等于不确定性的多少。2.香农用“比特”这个概念来度量信息量。3.变量的不确定性越大,熵也就越大。4.信息是消除不确定性的唯一办法。5.网页搜索本质上就是要从大量网页中,找到和用户输入的搜索词最相关的几个网页。网页搜索的本质上也是利用信息消除不确定性的过程。如果提供的信息不够多,那么会有很多相关的结果。这时正确的做法是挖掘新的隐含信息,比如网页本身的质量信息。如果这些信息还...原创 2019-03-13 19:32:24 · 986 阅读 · 0 评论