- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 java 并发包
java的并发包提供了好多 方便的方法,此处主要实验shutdown(),shutdownNow(),awaitTermination(); shutdown()指的是执行已经提交的任务,但是不接受新的任务。 shutdownNow()指的是停止正在执行的所有任务,暂停处理正在等待的任务,返回等待执行的任务列表。 awaitTermination(long timeout,TimeUnit
2013-09-25 10:02:24 298
原创 Nutch插件加载流程
首先介绍一下Nutch插件使用到的几个类: 1.PluginRepository:存储了PluginDescriptor,Extension,ExtensionPoint 2.PluginDescriptor:描述插件的元数据,从plugin.xml处获得 3.Plugin:插件的一个抽象 4.ExtensionPoint:扩展点,nutch有15个扩展点,所有插件都集中在nutch-ex
2013-09-01 14:13:44 553 1
原创 修改LanguageDetector 的语料库载入参数为 字节流
google推出的语言检测工具(http://code.google.com/p/language-detection/)十分好用,分辨率非常高,近期,需要将这个工具用到nutch1.7.因为nutch1.7的默认检测时tika,准确性十分差。 在使用该工具时,发现两个缺点(针对我的项目是缺点):1.语料库profile文件需要单独导入。2.导入函数只能接受File,这样在分布式环境下无法使
2013-08-27 11:02:35 875
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人