算法
文章平均质量分 74
ygrx
不以物喜不以己悲
展开
-
一种没有语料字典的分词方法
前几天在网上闲逛,看到一篇美文,说的是怎么在没有语料库的情况下从文本中提取中文词汇,理论部分讲得比较多,但都还是很浅显易懂的,其中涉及一部分信息论的理论,其实只要大学开过信息论这门课的话,看起来还是挺简单的。信息论我忘得差不多了,但是其中主要的内容还记得,信息论最主要的就是信息其实是可以度量的,一个事件包含的信息和它发生的概率成反比,简单的说,同样一个事件,产生A结果的概率为Pa,产生原创 2013-05-14 16:38:25 · 7824 阅读 · 3 评论 -
杨辉三角形变型【庞果网】
又一个庞果网的题目题目描述 1 1 1 1 1 2 3 2 11 3 6 7 6 3 1以上三角形的数阵,第一行只有一个数1, 以下每行的每个数,是恰好是它上面的数,左上的数和右上数等3个数之和(如果不存在某个数,认为该数就是0)。求第n行第一个偶数出现的位置。如果没有偶数,则输原创 2013-11-08 15:20:50 · 2452 阅读 · 4 评论 -
文本相似度计算-JaccardSimilarity和哈希签名函数
在目前这个信息过载的星球上,文本的相似度计算应用前景还是比较广泛的,他可以让人们过滤掉很多相似的新闻,比如在搜索引擎上,相似度太高的页面,只需要展示一个就行了,还有就是,考试的时候,可以用这个来防作弊,同样的,论文的相似度检查也是一个检查论文是否抄袭的一个重要办法。文本相似度计算的应用场景过滤相似度很高的新闻,或者网页去重考试防作弊系统论文抄袭检查光第一项的应用就非常广泛。原创 2013-10-15 13:57:23 · 47570 阅读 · 2 评论 -
子序列的个数 --- 庞果网
庞果网的新题目:题目描述本题同样来自caopengcs,只要你有兴趣,每个人都可以出题(出题入口在主页右侧边栏“贡献题目”->“我要发布”内),以下是题目详情:子序列的定义:对于一个序列a=a[1],a[2],......a[n],则非空序列a'=a[p1],a[p2]......a[pm]为a的一个子序列其中1对于给出序列a,有些子序列可能是相同的,这里只算做1个原创 2013-09-18 15:39:39 · 4521 阅读 · 2 评论 -
数组排序 --- 庞果
题目说明本题来自caopengcs,只要你有兴趣,每个人都可以出题(出题入口在主页右侧边栏“贡献题目”内),以下是题目详情:给定一个包含1-n的数列,我们通过交换任意两个元素给数列重新排序。求最少需要多少次交换,能把数组排成按1-n递增的顺序,其中,数组长度不超过100。例如:原数组是3,2,1, 我们只需要交换1和3就行了,交换次数为1,所以输出1。原数组是2,3,1原创 2013-09-04 15:12:59 · 3245 阅读 · 12 评论 -
不可表达的数 --- 梅森数 庞果题目
本题的奖品由亿阳信通赞助,以下是题目详情给定表达式[x/2] + y + x * y, 其中x,y都是正整数。其中的中括号表示下取整,例如[3/2] = 1 , [5/2] = 2。有些正整数可以用上述表达式表达出来,例如正整数2,当取x = y = 1时,可以把2表达出来 ( 解释下:当x=y=1时, [x / 2] + y + x * y = [1 / 2] +原创 2013-08-29 15:27:32 · 2224 阅读 · 6 评论 -
字符串消除
好久没来了,又一道庞果的题目给定一个字符串,仅由a,b,c 3种小写字母组成。当出现连续两个不同的字母时,你可以用另外一个字母替换它,如:有ab或ba连续出现,你把它们替换为字母c有ac或ca连续出现时,你可以把它们替换为字母b有bc或cb 连续出现时,你可以把它们替换为字母a。你可以不断反复按照这个规则进行替换,你的目标是使得最终结果所得到的字符串尽可能短,求最终结果原创 2013-08-28 10:37:38 · 4257 阅读 · 15 评论 -
寻找直方图中面积最大的矩形 --- 庞果网
又来了,今天做了好几道了。。还是庞果网的题目详情给定直方图,每一小块的height由N个非负整数所确定,每一小块的width都为1,请找出直方图中面积最大的矩形。 如下图所示,直方图中每一块的宽度都是1,每一块给定的高度分别是[2,1,5,6,2,3]: 那么上述直方图中,面原创 2013-07-24 16:27:27 · 6972 阅读 · 8 评论 -
24点计算 --- 庞果
问题描述24点游戏是一种使用扑克牌来进行的益智类游戏,游戏内容是:从一副扑克牌中抽去大小王剩下52张,任意抽取4张牌把牌面上的数(A代表1)运用加、减、乘、除和括号进行运算得出24。每张牌都必须使用一次,但不能重复使用。有些组合有不同种算法,例如要用2,4,6,12四张牌组合成24点,可以有如下几种组合方法:2 + 4 + 6 + 12 = 244 × 6 ÷ 2 +原创 2013-07-30 17:47:34 · 2574 阅读 · 0 评论 -
倒水问题---庞果网
还是庞果网,今天和他杠上了,倒水问题。题目详情有两个容器,容积分别为A升和B升,有无限多的水,现在需要C升水。我们还有一个足够大的水缸,足够容纳C升水。起初它是空的,我们只能往水缸里倒入水,而不能倒出。可以进行的操作是:把一个容器灌满;把一个容器清空(容器里剩余的水全部倒掉,或者倒入水缸);用一个容器的水倒入另外一个容器,直到倒出原创 2013-07-24 14:53:17 · 3409 阅读 · 2 评论 -
回文字符串
还是在庞果网看到的题目,这次选了个简单的,回文字符串。题目内容回文字符串是指从左到右和从右到左相同的字符串,现给定一个仅由小写字母组成的字符串,你可以把它的字母重新排列,以形成不同的回文字符串。输入:非空仅由小写字母组成的字符串,长度不超过100;输出:能组成的所有回文串的个数(因为结果可能非常大,输出对1000000007取余数的结果)。例如:输入"aabb" 输出为原创 2013-07-24 08:08:15 · 5367 阅读 · 4 评论 -
字符串的完美度
还是庞果网,又看到一个题目,这个比较简单。题目详情我们要给每个字母配一个1-26之间的整数,具体怎么分配由你决定,但不同字母的完美度不同,而一个字符串的完美度等于它里面所有字母的完美度之和,且不在乎字母大小写,也就是说字母F和f的完美度是一样的。现在给定一个字符串,输出它的最大可能的完美度。例如:dad,你可以将26分配给d,25原创 2013-07-24 10:14:34 · 2742 阅读 · 1 评论 -
最小操作数
给了A、B两个单词和一个单词集合Dict,每个的长度都相同。我们希望通过若干次操作把单词A变成单词B,每次操作可以改变单词中的一个字母,同时,新产生的单词必须是在给定的单词集合Dict中。求所有行得通步数最少的修改方法。 举个例子如下: Given: A = "hit" B = "cog" Dict = ["hot","dot","dog","lot","log原创 2013-07-23 08:17:37 · 2231 阅读 · 1 评论 -
PAXOS---最重要的分布式算法----简单模拟
最近由于某种原因需要学习分布式系统,其中涉及到分布式系统中的核心内容:PAXOS算法,据说此算法是分布式系统的基石,所有的分布式系统都是在此协议下进行的,是非常重要的分布式算法,用来保证系统的容错性和一致性的。关于PAXOS的历史和传奇故事有很多,wiki上大把,摘录一段,让大家也了解一下这个协议:分布式系统中的节点通信存在两种模型:共享内存(Shared memory原创 2013-05-28 15:17:32 · 3958 阅读 · 0 评论 -
[推荐算法]基于用户的协同过滤算法
什么是推荐算法推荐算法最早在1992年就提出来了,但是火起来实际上是最近这些年的事情,因为互联网的爆发,有了更大的数据量可以供我们使用,推荐算法才有了很大的用武之地。最开始,所以我们在网上找资料,都是进yahoo,然后分门别类的点进去,找到你想要的东西,这是一个人工过程,到后来,我们用google,直接搜索自己需要的内容,这些都可以比较精准的找到你想要的东西,但是,如果我自己都原创 2013-11-12 14:12:49 · 85898 阅读 · 36 评论