自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (24)
  • 问答 (1)
  • 收藏
  • 关注

原创 mapreduce 平均成绩

package org.mapreduce; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import

2016-06-29 20:38:41 856

原创 mapreduce

1、自定义key和value组合键类NewKeyPari public static class NewKeyPari implements WritableComparable{ Long first; Date second; public Long getFirst() { return first; } public void setFirst(Lon

2016-06-29 20:31:57 494

原创 java 时间格式转换

PDT、CST等时间格式转换为时间字符串 //PDT、CST等时间格式转换为时间字符串,Wed Sep 16 11:26:23 PDT 2009转换为2009-09-17 02:26:23 public void timeFormattTransform() throws ParseException{ String dateStr = "Wed Sep 16 11:26:23 PD

2016-06-29 20:23:34 798

原创 安装hadoop-hama

1、  在vmware forlinux上安装Centos6.5 2、  在centos上配置网络信息 3、  Centos创建用户“zhuhaichuan” 4、  关闭防火墙 5、  配置/etc/hosts文件 6、  Jdk安装 7、  ssh无密码登陆 8、  hadoop配置安装 9、  hama配置安装         注意:我的jdk安装在root用户中,ssh、

2016-06-18 13:12:57 1081

原创 apache-hama

hama的vertex比hadoop的mapreduce好用package org.May25.bjfcd201203; import java.io.IOException; import java.math.BigDecimal; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; i

2016-06-18 12:49:53 744

原创 java 相邻的数据处理

一个文件中有如下数据: 11 22 33 44 55 66 也就是说这个文件有6行,实现的功能是如:11+22;2+33;33+44;44+55; 55+66 实现代码如下: public void stringToshuzu(File file) throws IOException{ InputStream inputStream = new Buffer

2016-06-16 13:30:16 736

原创 match vertex

数据的输入: 1 A 2 3 4 5 14 19 2 B 8 9 3 C 8 4 B 5 7 5 E 6 7 6 F 7 G 8 E 9 D 8 10 10 E 11 12 11 F 12 G 13 D 5 14 H 15 16 17 18 15 I 16 J 17 K 18 M 19 C 20 20 H 21 22 21 I 22 J 要查询的数

2016-06-14 10:10:51 414

原创 抓取新浪数据

package cn.com.sample; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.ArrayList; import java.util.Date; import java.util.List; import java.util.regex.Matcher; im

2016-06-02 21:24:34 540

原创 抓取百度百科数据

package org.baidu.crawl; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileRe

2016-06-02 21:20:09 1392

原创 mongodb json

对mongodb数据的json的相关操作 package com.nextmap.jdbc.mongodb; import java.net.UnknownHostException; import java.util.ArrayList; import java.util.List; import java.util.Map; import java.util.Map.Entry; impo

2016-06-01 15:01:45 2336

原创 读取任意行数据

java读取任意一行的数据

2016-06-01 14:43:36 660

原创 json解析

我自己写,感觉很有多不足的地方,不过凑合能出结果,欢迎交流

2016-06-01 14:32:29 473

Delta Lake数据湖 English Version

Delta Lake - The Definitive Guide 基于Delta Lake的湖仓一体的现代数据架构,主要包括常规的基本代码用例,历史审计和时间旅行管理,流批一体等原理讲解和使用代码样例讲解和分析

2023-01-03

DataStage_V7.5_学习总结.doc

DataStage 可以从多个不同的业务系统中,从多个平台的数据源中抽取数据,完成转换和清洗,装载到各种系统里面。其中每步都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来设计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能。其中简单的数据转换可以通过在界面上拖拉操作和调用一些 DataStage 预定义转换函数来实现,复杂转换可以通过编写脚本或结合其他语言的扩展来实现,并且 DataStage 提供调试环境,可以极大提高开发和调试抽取、转换程序的效率

2021-01-05

TigerGraph图数据库应用.docx

是关于图数据库TigerGraph的基本操作,包括vertex、edge、graph的操作,而且还包含累加器、函数、GraphStudio的操作、图算法的应用等

2020-07-26

scala语言pdf_带目录标签

快学Scala、scala函数式编程、Scala编程实战:三本书籍,带目录和标签

2018-09-20

svm的详细介绍

对svm(支持向量机)不是太熟的同学可以看看这个文档,讲解的很详细

2017-10-30

python基础教程

本书是经典教程的全新改版,作者根据Python 3.0版本的种种变化,全面改写了书中内容,做到既能“瞻前”也能“顾后”。本书层次鲜明、结构严谨、内容翔实,特别是在最后几章,作者将前面讲述的内容应用到了10个引人入胜的项目中,并以模板的形式介绍了项目的开发过程。本书既适合初学者夯实基础,又能帮助Python程序员提升技能,即使是 Python方面的技术专家,也能从书里找到令你耳目一新的东西。

2017-09-27

hadoop海量数据处理详解与项目实战

hadoop海量数据处理技术详解,包括hdfs、MapReduce、hive、sqoop等相关技术和伪代码,代码是使用python语言写的。

2017-09-27

eclipse-svn包

eclipse工具中配置svn插件得jar包,直接使用第三方的svnjar包方便大家配置svn插件,把svn包下的features/*和plugins/*分别复制到eclipse下的features和plugins路径下

2017-09-04

hbase权威指南-带目录有标签

hbase权威指南-带目录有标签,带目录有标签

2017-08-03

hive编程指南-带书签有目录

hive编程指南-带书签有目录

2017-07-28

某平台java爬虫代码

对某个电影平台的信息采集,很详细

2017-07-19

sfntly-master

用于对提取和解析ttf、eot、woff等字体

2016-11-24

java基础思维导图结构

用思维导图管理和学习java知识,很方便利于记忆

2016-09-13

网页抓取jar包

jsoup-1.8.3相关的jar包

2016-07-13

json-simple-1.1.1.jar

是google的json-simple.1.1.1.jar,功能很强大,很好用。

2016-06-01

mongodb数据库

mongodb数据库的配置和一些相关命令

2016-01-22

hadoop-eclipse-lpugin

hadoop在eclipse上运行的插件,步骤: 1、把hadoop-eclipse-plugin包放到eclipse的plugins目录下 2、启动eclipse,Windows>preferences>hadoop map/reduce设置hadoop路径 3、打开mapreduce视图,window>show view>other>mapreducer locations 4、编辑你的mapreduce,设置你port等

2015-12-08

mongodbDB帮助文档

主要是前辈们整理的资料,弄了一个帮助文档,里面有很多内容,安装、管理命令、mongodb的相关知识,还有很多的代码供大家学习

2015-11-29

XMLConvertToJSON.jar

common-beanutils、commons-colletions、commons-httpclient、commons-lang、commons-logging、ezmorph、json-lib、xom

2015-11-27

MongoDB安装配置MongoVUE

MongoDB安装和配置,用MongoVUE连接MongoDB,shell,相关命令

2015-11-26

数据格式的转换

xml格式的数据转换为json格式的数据,

2015-11-25

hadoop-common-2.7.0.jar

The JAR file M2_REPO/org/apache/////has no source attachment you can attach the source by clicking attach source below

2015-09-15

在VirtualBox上安装CentOS6.5

在VirtualBox上安装CentOS6.5,很详细的linux系统安装

2015-09-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除