搜索引擎
文章平均质量分 66
梦里花又落
程序员之所以犯错误,不是因为他们不懂,而是因为他们自以为什么都懂。
算法和数据结构就是编程的一个重要部分,你若失掉了算法和数据结构,你就把一切都失掉了。
算法和数据结构是程序的第一秘诀,缺之算法和数据结构是编程的最大原因。
编程之久除了算法和数据结构,什么也不属于我们。
编程就是算法和数据结构,算法和数据结构是编程的灵魂。
编程中最没用的东西是源代码,最有用的东西是算法和数据结构。
程序员的一生时间90%是用在编程上,而剩余的10%是活在世界上。
有编过程的人的代码,比那些无知的人使用的软件更有价值。
当你还不能写出自己满意的程序时,你就不要去睡觉。
展开
-
Cygwin运行nutch报错:Failed to set permissions of path
错误信息:Exception in thread "main" java.io.IOException:Failed to set permissions of path:\tmp\hadoop-ysc\mapred\staging\官方BUG参考:https://issues.apache.org/jira/browse/HADOOP-7682转载 2015-06-25 16:34:34 · 397 阅读 · 0 评论 -
中文分词技术(中文分词原理)
中文分词技术(中文分词原理)一、 为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(包括向前、向后、以转载 2015-06-10 17:31:48 · 426 阅读 · 0 评论 -
solr MoreLikeThis的原理分析
在solr中有两种方式实现MoreLikeThis:MoreLikeThisHandler和在SearchHandler中的MoreLikeThisComponent。两种方式大同小异:一是:将MoreLikeThis作为一个单独的Handler来处理,体现主体地位。二是:将MoreLikeThis作为一个组件放到SearchHandler中,为Search加入了MLT的功转载 2015-06-10 17:36:01 · 688 阅读 · 0 评论 -
Solr常见问题记录
这两天再使用solr的过程中遇到了一些问题,记录一下,方便以后查阅原创 2015-07-22 21:30:16 · 1230 阅读 · 1 评论