吴军-《数学之美》读书笔记

    最近在拜读吴军博士的《数学之美》这本书,大有醍醐灌顶,相见很晚的感觉,故整理下学习笔记,记录启发。

    1.搜索引擎的“道”:自动下载尽可能多的网页;简历快速有效的索引;根据相关性对网页进行公平准确的排序。简化其根本是对索引进行布尔运算

    2.图论与搜索引擎: 遍历算法有广度优先算法(BFS),深度优先算法(DFS)。网络爬虫使用离散表(哈希表)来记录网页是否下否下载过的信息。决定网页下载优先级排序的系统一般称为“调度系统”。

    3. google的革命性“PageRank”网页排序算法:民主表决式-一个网页被很多其他网页所链接,说明他受的信赖和承认越高,排名就越靠前。网页排名计算原理为矩阵相乘,对零概率或小概率事件进行平滑处理。

    4. TF-IDF :信息检索关键词的加权科学方法。TF(Term Frequency)为词频,IDF(Inverse Document Frequency)为逆文本频率指数,log(D/Dw),D为全部网页数,Dw为关键词出现的网页数。

    5.地址分析和有限状态机, 全球导航和动态规划

    6. AK-47:简单有效的哲学,简单有效的方案容易解释方法背后的原理,出错时容易debug,也便于找到今后的改进目标

    持续更新。。。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值