学习周报202000410 | 再开两本书读起来

【学习周报】

总结自己的学习和遇到的好材料。

往期回顾:

上回把《机器学习实战》那本书读完了,那就继续开始看书吧哈哈哈,这次选择的两本书是有这深度学习圣经之称的《深度学习》和信息检索领域的《信息检索导论》。

前者看的比较认真,主要还是想巩固一下基础,而后者,本次阅读不打算理解的特别深,而是知道点背景知识,当然后续要提升会多看几遍。简单回顾一下:

深度学习

看了两章,前面的内容还是比较简单的。

  • 引言。额,没什么好说的,就是简介吧。

  • 线性代数。其实学起来不是特别难,就是线性代数里面的几个核心概念而已。有个比较奇怪的点,就是主成分分析感觉谈的有些杂,没太说在点子上,累计贡献率之类的都没说太清楚,建议大家找别的材料也多看看,补充一下。

信息检索导论

清明假期长,一口气整了8章,好刺激。

  • 布尔检索。对基本的检索逻辑进行阐述,难度不大。

  • 词项词典和倒排期记录表。倒排检索和词典可谓是搜索引擎的一大核心,怎么处理,权衡各种资源的分配非常重要。

  • 词典及容错式检索。有关容错、纠错,从数据端到query层面都有谈到,虽然复杂的模型没有,但是基本操作都有,问题是很多内容都是从英文层面讲的,和中文有一定差异。

  • 索引构建。如何快速找到需要的文档,来源于索引,合理建立索引,非常重要。

  • 索引压缩。随着数据的增加,索引也会增加,为了不必要的存储,有必要做索引压缩工作。

  • 文档、词项的计算。这种计算很多,不过其实不复杂,重点是讲清楚操作步骤,类似tf-idf之类的。

  • 搜索系统评分计算。说白了其实就是query和doc之间的匹配度分析,当然里面还会涉及索引、检索、排序的细节问题。

  • 搜索引擎评估。提了一些搜索引擎评估的标准方法,个人感觉有些用,但是现实场景似乎用的不是很多,可能和各个场景有关吧。

这本书看到现在,感觉上真的能被称为一本教材,细节和底层技术说得很清楚,自己收获也很大,不过应用性稍微欠缺一些,有了自己的实践结合这个会有一些自己的体会。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值