- 博客(12)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 mapreduce 平均成绩
package org.mapreduce; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import
2016-06-29 20:38:41 856
原创 mapreduce
1、自定义key和value组合键类NewKeyPari public static class NewKeyPari implements WritableComparable{ Long first; Date second; public Long getFirst() { return first; } public void setFirst(Lon
2016-06-29 20:31:57 494
原创 java 时间格式转换
PDT、CST等时间格式转换为时间字符串 //PDT、CST等时间格式转换为时间字符串,Wed Sep 16 11:26:23 PDT 2009转换为2009-09-17 02:26:23 public void timeFormattTransform() throws ParseException{ String dateStr = "Wed Sep 16 11:26:23 PD
2016-06-29 20:23:34 798
原创 安装hadoop-hama
1、 在vmware forlinux上安装Centos6.5 2、 在centos上配置网络信息 3、 Centos创建用户“zhuhaichuan” 4、 关闭防火墙 5、 配置/etc/hosts文件 6、 Jdk安装 7、 ssh无密码登陆 8、 hadoop配置安装 9、 hama配置安装 注意:我的jdk安装在root用户中,ssh、
2016-06-18 13:12:57 1081
原创 apache-hama
hama的vertex比hadoop的mapreduce好用package org.May25.bjfcd201203; import java.io.IOException; import java.math.BigDecimal; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; i
2016-06-18 12:49:53 744
原创 java 相邻的数据处理
一个文件中有如下数据: 11 22 33 44 55 66 也就是说这个文件有6行,实现的功能是如:11+22;2+33;33+44;44+55; 55+66 实现代码如下: public void stringToshuzu(File file) throws IOException{ InputStream inputStream = new Buffer
2016-06-16 13:30:16 736
原创 match vertex
数据的输入: 1 A 2 3 4 5 14 19 2 B 8 9 3 C 8 4 B 5 7 5 E 6 7 6 F 7 G 8 E 9 D 8 10 10 E 11 12 11 F 12 G 13 D 5 14 H 15 16 17 18 15 I 16 J 17 K 18 M 19 C 20 20 H 21 22 21 I 22 J 要查询的数
2016-06-14 10:10:51 414
原创 抓取新浪数据
package cn.com.sample; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.ArrayList; import java.util.Date; import java.util.List; import java.util.regex.Matcher; im
2016-06-02 21:24:34 540
原创 抓取百度百科数据
package org.baidu.crawl; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileRe
2016-06-02 21:20:09 1392
原创 mongodb json
对mongodb数据的json的相关操作 package com.nextmap.jdbc.mongodb; import java.net.UnknownHostException; import java.util.ArrayList; import java.util.List; import java.util.Map; import java.util.Map.Entry; impo
2016-06-01 15:01:45 2336
Delta Lake数据湖 English Version
2023-01-03
DataStage_V7.5_学习总结.doc
2021-01-05
TigerGraph图数据库应用.docx
2020-07-26
python基础教程
2017-09-27
hadoop海量数据处理详解与项目实战
2017-09-27
eclipse-svn包
2017-09-04
hadoop-eclipse-lpugin
2015-12-08
XMLConvertToJSON.jar
2015-11-27
hadoop-common-2.7.0.jar
2015-09-15
在维基百科上下载50G的xml导入mysql
2015-06-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人