![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法分析
文章平均质量分 81
剑儒
阿里乐天派小码农一枚。。。
展开
-
算法学习心得——动态规划法实现最长公共子序列(LCS)
算法学习心得——动态规划法实现最长公共子序列(LCS)一.问题说明欲定义最长公共子序列(Longest Common Subsequence)问题,首先需要引入两个辅助性的概念,即:子序列的概念和公共子序列的概念。 子序列的概念形式化为:设X = 1, x2,┅, xm>,若有1≤i12k≤m,使得Z=1,z2,┅, zk> = i1, xi2,┅, xik>,则称Z是X的子序列原创 2012-02-14 16:29:19 · 4008 阅读 · 1 评论 -
位操作基础篇之位操作全面总结
位操作篇分为基础篇和提高篇,基础篇主要对位操作进行全面总结,帮助大家梳理知识。提高篇则针对各大IT公司如微软、腾讯、百度、360等公司的笔试面试题作详细的解答,使大家能熟练应对在笔试面试中位操作题目。下面就先来对位操作做个全面总结,欢迎大家补充。在计算机中所有数据都是以二进制的形式储存的。位运算其实就是直接对在内存中的二进制数据进行操作,因此处理数据的速度非常快。在实际编程中,如果能巧妙运用位原创 2014-04-08 21:45:31 · 742 阅读 · 0 评论 -
背包问题深度解析
背包问题深度解析:01背包 &完全背包 & 多重背包,重点推导出动态转移方程01背包问题:有N件物品和一个容量为V的背包,第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使价值总和最大。(01背包问题:物品都仅有一件,要么选中物品;要么不选择物品,物品不可分隔)基本思路:用f[i][v]表示前i件物品恰好放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是原创 2014-04-07 21:50:32 · 1154 阅读 · 0 评论 -
基于贝叶斯方法的英文单词模糊自动校对技术及其应用研究
摘要:概述了英文文本自动校对技术的产生背景,分析了英文文本的特点,并对英文文本校对的技术难点和解决方法以及国内外的研究现状进行了阐述。在此基础上重点讨论了基于贝叶斯方法的英文单词自动校对技术的实现。关键字:贝叶斯方法;模糊自动校对;非词错误(单词错误) English words based on the Bayesianapproach to fuzzy automatic proo原创 2012-02-14 16:26:19 · 2444 阅读 · 1 评论 -
从Hadoop框架与MapReduce模式中谈海量数据处理
前言:几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,觉得Hadoop是一项富有趣味和挑战性的技术,且它还牵扯到了一个我更加感兴趣的话题:海量数据处理。由此,最近凡是空闲时,便在看“Hadoop”,“MapReduce”“海量数据处理”这方面的论文。但在看论文的过程中,总原创 2014-04-21 14:56:19 · 802 阅读 · 0 评论 -
海量数据处理之Bloom Filter详解
一、什么是Bloom FilterBloomFilter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。BloomFilter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(falsepositive)。因此,BloomFilter不适合那些“零错误”的应用场合。而在能容忍低错误原创 2014-04-21 15:08:46 · 736 阅读 · 0 评论 -
海量数据处理:十道面试题与十个海量数据处理方法总结
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000转载 2014-04-21 14:38:05 · 943 阅读 · 0 评论 -
教你如何迅速秒杀掉:99%的海量数据处理面试题
前言:一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,:-)。毕竟受文章和理论之限,本文将摒弃绝大部分的细节,只谈方法/模式论,且注重用最通俗最直白的语言阐述相关问题。最后,有一点必须强调的是,全文行文是基于面试题的分析基础之上的,具体实践过程中,还是得具体情况具体分析,且场转载 2014-04-21 14:40:19 · 1303 阅读 · 0 评论 -
海量数据处理常用算法、数据结构总结
1. Bloom Filter【Bloom Filter】 Bloom Filter(BF)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概率算法。Bloom Filter有可能会出现错误判断,但不会漏掉判断。Bloom Filter判断元素不在集合,那肯定不在;如果判断元素存在转载 2014-04-21 14:35:51 · 3219 阅读 · 0 评论 -
我的算法学习之路
关于严格来说,本文题目应该是我的数据结构和算法学习之路,但这个写法实在太绕口——况且CS中的算法往往暗指数据结构和算法(例如算法导论指的实际上是数据结构和算法导论),所以我认为本文题目是合理的。如果你使用的是手机或平板设备,那么请点击下面的链接以获得更好的阅读效果:http://zh.lucida.me/blog/on-learning-algorithms/原文作转载 2014-05-05 17:10:10 · 738 阅读 · 0 评论 -
我的面试准备纲要
本文是我在2013年找工作时给自己准备的面试纲要,此时以博客的形式写出来也算是对自己研究生生涯的一个小小总结吧。面试准备(1) 在纸上写代码;(2) 熟悉你的简历:对参与的项目或者科研活动进行总结;阐述解决过得最困难的或者最有意义的问题;(3) 切记,不要机械地记忆算法书上的解答,而是要理解算法实质;(4) 面试官希望了解你思考和处理问题的方式,因此在解决问原创 2014-05-15 10:55:53 · 1400 阅读 · 0 评论