![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
大数据学习笔记
熵之极
这个作者很懒,什么都没留下…
展开
-
pagerank笔记
一、算法起源 当用户浏览网页时,输入关键词搜索,搜索引擎会根据关键字去倒排索引库中匹配,搜索处一系列的网页,然后根据重要性从上到下返回给用户。pagerank算法就是根据指标对网页进行重要性排序。 二、算法原理 假设有n个节点(也就是n个网页)。最终希望得到一个向量Pn,存储n个节点的重要性指标:pr值。 直接引入随机模型: 符合马克洛夫模型,收敛: 避免陷阱问题和终止点问题。 三、算法实现(mapreduce) 1.模拟流程图 2.代码实现 3收敛 (1)小数据测试,三十七次完全收敛 (2)验证原创 2020-11-26 14:29:01 · 212 阅读 · 0 评论 -
大数据篇
好久了,没时间整理大数据笔记,现在没时间搞开发,安心学数学。现在占个地方,以后要是搞开发了有空再回来整理笔记 http://note.youdao.com/s/Oz4A7EkU原创 2020-11-12 23:57:47 · 126 阅读 · 0 评论