搜索引擎
yesIcando-bupt
stay hungry stay foolish
展开
-
搜索引擎技术之概要预览
搜索引擎技术之概要预览 2016-11-19 10:41 42人阅读 评论(0) 收藏 举报 分类: 机器学习(66) 目录(?)[+] 前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查转载 2016-12-11 21:36:43 · 206 阅读 · 0 评论 -
海量数据处理之面试题
给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为,这里漏写个了a1)中。这样每个小文件的大约为3转载 2017-03-06 10:26:09 · 199 阅读 · 0 评论 -
MyISAM与InnoDB的区别
MySQL默认采用的是MyISAM。 MyISAM不支持事务,而InnoDB支持。InnoDB的AUTOCOMMIT默认是打开的,即每条SQL语句会默认被封装成一个事务,自动提交,这样会影响速度,所以最好是把多条SQL语句显示放在begin和commit之间,组成一个事务去提交。 InnoDB支持数据行锁定,MyISAM不支持行锁定,只支持锁定整个表。即MyISAM同一个表上的读锁和写锁是互斥的原创 2017-04-18 16:59:02 · 183 阅读 · 0 评论