精读笔记
收集本人的读书笔记,用通俗易懂的语言将不同学科的知识转述给读者
MC_Dream
Keep curious!
展开
-
搜索引擎之美
目录一、网络爬虫二、索引和布尔算法三、网页排序算法 技术分为两种:道和术,道是做事的原则和原理;术是具体的做事方法。 ——吴军《数学之美》 如果把技术比喻成一颗参天大树,“道”就是最底下的树干,而“术”只是从树干延伸出去的一片片叶子,只有掌握了“道”,才能发展成一个个“术”。在深度学习中,算法有千千万万种,全世界有那么多的研究者,几乎每...原创 2019-05-26 17:55:14 · 339 阅读 · 0 评论 -
最短路线与动态规划
目录一、动态规划二、拓展思考 如今,GPS导航为我们的交通出行带来了极大的便利,尤其是对于MC君这种路痴而言,出行已经依赖了地图导航。在地图导航软件中,我们最常用到的功能就是搜寻最短路程的路线或者最短时间的路线,我们知道,城市路网是错综复杂的,如果要遍历从出发地到终点的所有路线,计算量是巨大的,耗时也很长,那导航系统究竟是如何做到在最短的时间内搜寻到最短路线呢?吴...原创 2019-05-29 18:11:38 · 3063 阅读 · 1 评论 -
文本分类与线性代数
目录一、余弦距离二、聚类算法三、奇异值分解 现如今,有些新闻网站已经不做新闻的“生产者”,它们只做新闻的“搬运工”,也就是说这些网站本身不编辑任何的新闻,它们只是对网络上已有的新闻进行分类,聚合,然后推荐给用户,那么在这个“搬运”过程中就涉及到一个很关键的技术——文本分类。所谓文本分类,顾名思义,就是让计算机根据内容自动地将文本进行归类。当然,计算机是“看”不...原创 2019-06-06 21:22:06 · 454 阅读 · 0 评论 -
原理解析——奇异值分解(SVD)
奇异值分解(SVD)是矩阵分析中的重要内容,既然在新闻分类中应用到了,MC君就要详细地说说其中的原理。 我们学线性代数时就知道,一个实对称矩阵一定可以对角化。若矩阵是实对称矩阵,则必有:,其中是对角矩阵,对角线上的元素就是的特征值,是正交矩阵(中的每个列向量为的特征向量,且是两两正交的单位向量)。所以只有对称矩阵才可以分解成两个正交矩阵和一个对角阵,但如果我想把一个普...原创 2019-06-01 09:59:07 · 548 阅读 · 0 评论 -
语音识别与隐马尔可夫模型(HMM)
目录一、语音识别二、隐马尔可夫模型三、前向—后向算法四、Baum-Welch算法五、孤立词识别 公元2035年,机器人在人类社会中充当着十分重要的角色,它们可以送快递,为人类提供家政服务,甚至帮主人可以遛狗……这是电影《机械公敌》中的场景,这要是放在十几年前,可能还是有点异想天开,但是现在,原先的很多设想都已经初步实现了,例如可以跟人对话的聊天机器人,...原创 2019-06-16 22:48:08 · 2385 阅读 · 1 评论 -
中文分词与维特比算法
目录一、BEMS二、维特比算法 我们几乎每天都在用搜索引擎,MC君也在搜索引擎之美一文中解释了搜索的基本原理,但对于中文搜索引擎,还有一项技术非常重要,那就是——中文分词技术,为什么这么说?我们平常搜索的时候,一般都是习惯输入一段句子或者长词组,如果是英文的话,它并不需要分词,因为英文的每个单词都有空格隔开,计算机可以根据空格自动识别每个关键词,但中文每个字都是连...原创 2019-06-18 16:00:06 · 884 阅读 · 1 评论