自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 hadoop读取目录下的文件列表

[code="java"]/** * @see 读取path下的所有文件 * @param path * @return * @throws IOException */ public static String[] getFileList(String path) throws IOException{ Con...

2015-01-08 17:47:46 1977

原创 hadoop创建文件,如文件存在则追加内容

[code="java"]public static void createNewFile(String path, String content, FileSystem fs) throws Exception{ Configuration conf = new Configuration(); conf.set("dfs.support.append", "true...

2015-01-08 17:47:35 2043

原创 Plugins: directory not found: plugins java.lang.RuntimeException: Error in confi

Plugins: directory not found: pluginsjava.lang.RuntimeException: Error in configuring object在nutch-site.xml中添加:[code="java"] plugin.folders apache-nutch-1.6\src\plugin[/code]...

2015-01-08 17:47:17 2094

原创 hadoop读取文件内容

[code="java"]/** * @see 读取dst文件内容 * @param dst * @return * @throws Exception */ public static byte[] readHDFSFile(String dst) throws Exception { Conf...

2015-01-07 11:00:20 274

原创 http://www.xxx.com/ skipped. Content of size 67099 was truncated to 59363

如果提示http://www.xxx.com/ skipped. Content of size 67099 was truncated to 59363在nutch-site.xml中添加:[code="java"] parser.skip.truncated false [/code]这是因为网站的页面内容采用truncate的方式分段返回,而nutch...

2015-01-07 10:56:31 1519085 1

修改conf中的文件没有效果

如果修改了conf中的文件而没有效果的话试着重新ant编译一下。比如在本地执行可以爬取而在hadoop上不能爬取,可能是hadoop上不能识别新修改的配置文件而把url都filter掉了。用ant命令重新编译一次就好了...

2015-01-07 10:55:11 547

原创 hadoop检测不到datanode

如果检测不到datanode就把/etc/hosts里对本主机hostname的映射注释掉,对本主机的映射只留下一个127.0.0.1 localhost就可以了。这个应该是优先级的原因,节点在解析hostname时由于127.0.0.1 hostname在前面,就把hostname解析成了127.0.0.1,在完全分布式的部署上就会出现检测不到datanode。...

2015-01-07 10:53:16 458

原创 (转)hadoop编程笔记

FileInputFormat.setMinInputSplitSize(job, 2L * 1024 * 1024 * 1024);将使得小于 2G 的输入文件不会被分割处理。如果你的输入文件中有很多都是小于2G的,并且你的Hadoop集群配置了一个split的大小是默认的64M,那么就会导致 一个1点几G的文件就会被很多个map处理,从而导致输出文件数量很多。使用上面的方法设置了min i...

2015-01-07 10:50:25 104

java单链表冒泡排序

去面试的一家公司出的面试题,让我回来做完发过去,记录一下 :arrow: 节点类:[code="java"]//节点类class Node{ public Node(int value){ this.value = value; } public Node(){ } int value; Node next;}[/code]获得随机的链表...

2014-04-18 13:21:23 1587 1

原创 java逆转单链表

节点类:[code="java"]//节点类class Node{ public Node(int value){ this.value = value; } public Node(){ } int value; Node next;}[/code]初始化链表[code="java"]//初始化一个有序的单链表 public ...

2014-04-18 13:15:07 209

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除