关闭

PageRank算法与特征向量和特征值(eigenvector和eigenvalue)

1. PageRank算法概述          PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。         是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模型。目前很多重要的链接分析算法都是在PageRank算法基础上...
阅读(17) 评论(0)

五大常用算法之二:动态规划算法

一、基本概念     动态规划过程是:每次决策依赖于当前状态,又随即引起状态的转移。一个决策序列就是在变化的状态中产生出来的,所以,这种多阶段最优化决策解决问题的过程就称为动态规划。 二、基本思想与策略     基本思想与分治法类似,也是将待求解的问题分解为若干个子问题(阶段),按顺序求解子阶段,前一子问题的解,为后一子问题的求解提供了有用的信息。在求解任一子问题时,列出各种可能...
阅读(29) 评论(0)

动态规划之背包问题——Java实现

背包问题具体例子:假设现有容量10kg的背包,另外有3个物品,分别为a1,a2,a3。物品a1重量为3kg,价值为4;物品a2重量为4kg,价值为5;物品a3重量为5kg,价值为6。将哪些物品放入背包可使得背包中的总价值最大? 首先想到的,一般是穷举法,一个一个地试,对于数目小的例子适用,如果容量增大,物品增多,这种方法就无用武之地了。   其次,可以先把价值最大的物体放入,这已经是贪婪算法的...
阅读(34) 评论(0)

几种压缩算法原理介绍

1 RLE RLE 又叫 Run Length Encoding ,是一个针对无损压缩的非常简单的算法。它用重复字节和重复的次数来简单描述来代替重复的字节。尽管简单并且对于通常的压缩非常低效,但它有的时候却非常有用(例如, JPEG 就使用它)。 1.1 原理 图 2.1 显示了一个如何使用 RLE 算法来对一个数据流编码的例子,其中出现六次的符号‘ 93 ’已经用 3 个字节来代替:一个标...
阅读(31) 评论(0)

集束搜索(Beam Search Algorithm )

看计算机科学中最重要的32个算法,其中有个是集束搜索(又名定向搜索,Beam Search)——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过,集束搜索只能在每个深度中发现前m个最符合条件的节点,m是固定数字——集束的宽度。 泛泛的介绍,不是很能理解清楚,于是有百度又google,写篇东西备忘。先贴维基百科的地址:Beam Search 翻译过来就是: Beam Se...
阅读(75) 评论(0)

概率分析和随机算法

一、随机分析 考虑一个雇佣问题,面试n个人,在面试的过程中,只要更为优秀的人出现,就雇佣更为优秀的人,但是更换人选需要花费一笔费用c,现在估算这笔费用。 这个问题相当于维护一个当前的“获胜者”。 最坏的情形当然是替换n次,那么费用就会是cn. 随机的情况: 第i个人比前i-1个人更为优秀的概率为1/i,那么期望E[X] = 1/1 +1/2 +1/3 + …… = ln n + ...
阅读(29) 评论(0)

最短路径—Dijkstra算法和Floyd算法

Dijkstra算法 1.定义概览 Dijkstra(迪杰斯特拉)算法是典型的单源最短路径算法,用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法是很有代表性的最短路径算法,在很多专业课程中都作为基本内容有详细的介绍,如数据结构,图论,运筹学等等。注意该算法要求图中不存在负权边。 问题描述:在无向图 G=(V,E) 中,假...
阅读(167) 评论(0)

回溯法

一. 回溯法 – 深度优先搜素                        1. 简单概述        回溯法思路的简单描述是:把问题的解空间转化成了图或者树的结构表示,然后使用深度优先搜索策略进行遍历,遍历的过程中记录和寻找所有可行解或者最优解。 基本思想类同于: 图的深度优先搜索二叉树的后序遍历       【          分支限界法:广度优先搜索         ...
阅读(55) 评论(0)
    个人资料
    • 访问:26003次
    • 积分:1393
    • 等级:
    • 排名:千里之外
    • 原创:114篇
    • 转载:14篇
    • 译文:1篇
    • 评论:1条
    最新评论
  • Spark RDD

    testcs_dn: 把一个超大的数据集,切分成N个小堆,Hadoop大文件并行处理不是这样做的吗?