Little-Spark
码龄15年
关注
提问 私信
  • 博客:66,678
    社区:3,019
    69,697
    总访问量
  • 21
    原创
  • 387,862
    排名
  • 13
    粉丝
  • 0
    铁粉

个人简介:路漫漫其修远兮,吾将上下而求索

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2010-03-20
博客简介:

Little-Spark的专栏

查看详细资料
个人成就
  • 获得9次点赞
  • 内容获得1次评论
  • 获得25次收藏
创作历程
  • 2篇
    2016年
  • 23篇
    2015年
成就勋章
TA的专栏
  • 学习
    5篇
  • Hadoop
    3篇
  • HBase
    1篇
  • Java
    1篇
  • Hive
    2篇
  • kafka
    3篇
  • flume
    2篇
  • storm
    1篇
兴趣领域 设置
  • 数据结构与算法
    排序算法推荐算法
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

大数据项目开发步骤

第一步:需求:数据的输入和数据的产出,大数据技术就好比一台榨汁机,数据输入相当于例如苹果、柠檬等,然后通过榨汁机产出果汁;第二步:数据量、处理效率、可靠性、可维护性、简洁性;第三步:数据建模;第四步:架构设计:数据怎么进来,输出怎么展示,最最重要的是处理流出数据的架构;第五步:再次思考大数据系统和企业IT系统的交互;第六步:最终确定选择、规范等;第七步:基于数据建模写基础服
原创
发布博客 2016.10.07 ·
8435 阅读 ·
1 点赞 ·
0 评论 ·
22 收藏

使用IDEA构建Spark开发环境(支持maven)

1、打开Idea,新建maven工程\新建maven项目成功后之后,就会看到如下工程结构:2、修改pom.xml文件增加如下内容: Akka repository http://repo.akka.io/releases
原创
发布博客 2016.03.24 ·
10141 阅读 ·
3 点赞 ·
0 评论 ·
12 收藏

面试题汇总

1、hashtable和linkedtable的区别2、虚类和接口的区别3、hadoop的二级排序4、
原创
发布博客 2015.12.13 ·
562 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

linux下时间同步的方法

1、使用命令crontab -e,加入如下代码:*/1 * * * *  /usr/sbin/ntpdate time.nist.gov  >>/test.log说明:每分钟执行一次时间同步,并把日志输出到/text.log文件中2、删除本地时间并设置时区为上海rm -rf /etc/localtimeln -s /usr/share/zoneinfo/Asia/Sha
原创
发布博客 2015.11.29 ·
503 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何提高自己的技能

1. 提高硬实力:没有过硬的编程水平,一切免谈。所以先练好编程武功,再说格调。现在网络上免费学习资源特别多,根本没必要花大钱去参加什么培训班。会自学的在家里学习绝对比培训机构强N倍。小编自学至今就基本没花过什么钱,PDF都有百度云盘什么的免费下载,软件么你懂的,视频也有免费下载或在线观看的,无需花钱买什么网站的VIP年会员。加入程序员联盟,有很多编程资源共享。多去Github,Gitlab,Hac
转载
发布博客 2015.11.23 ·
558 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Flume与Kafka整合之把flume中的数据sink到Kafka

一、说明版本介绍:apache-flume-1.6.0-bin + kafka_2.10-0.8.2.0场景说明:把flume中的数据sink到Kafka集群说明:192.168.215.90     broker、consumer、zookeeper 、flume192.168.215.110   broker、zookeeper192.168.2
原创
发布博客 2015.10.18 ·
11502 阅读 ·
4 点赞 ·
0 评论 ·
11 收藏

storm集群搭建

一、集群部署如下:192.168.215.90    主节点Nimbus192.168.215.110   工作节点Supervisor        192.168.215.120   工作节点Supervisor二、安装zookeeper集群(要保证集群各个节点的时间保持一致)为保证集群各个节点的时间保持一致,需要创建一个定时器,同步服务器时间:命令如下cron
原创
发布博客 2015.10.18 ·
549 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

BSFrameWorkExam

发布资源 2015.10.15 ·
rar

SpringMVC工程

发布资源 2015.10.15 ·
zip

flume的使用

1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。3.agent里面包含3个核心组件:source、channel、sink。3.1 source组件是专用于收集日志的,可以处理各种类型各种格式的日志数据,包括avro、thrift、exec、jms、spooling d
原创
发布博客 2015.10.09 ·
530 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Kafka的JAVA操作

一、在pom.xml文件中添加依赖org.apache.kafkakafka_2.100.8.2.0二、编写生产者Producer package kafka;import java.util.Properties;import kafka.producer.KeyedMessage;import kafka.producer.ProducerCo
原创
发布博客 2015.10.08 ·
1014 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

kafka集群搭建

搭建kafka集群,首先得搭建ZooKeeper集群,请参见《ZooKeeper集群搭建》机器部署角色情况如下:192.168.215.90     broker、producer、consumer192.168.215.110   broker、consumer192.168.215.120   broker一、在每个节点启动ZooKeeper服务zk
原创
发布博客 2015.10.08 ·
547 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ZooKeeper集群搭建

1.ZooKeeper1.1 zk可以用来保证数据在zk集群之间的数据的事务性一致。2.如何搭建ZooKeeper服务器集群2.1 zk服务器集群规模不小于3个节点,要求各服务器之间系统时间要保持一致。2.2 在hadoop0的/usr/local目录下,解压缩zk....tar.gz,设置环境变量  解压缩:tar -zxvf zookeeper-3.4.5.tar.gz
原创
发布博客 2015.10.07 ·
542 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive通过动态分区装载数据

进入hive:1、创建分区表t12create table t12(id int,name string) partitioned by (year:int,month:int) row format delimited fields terminated by '\t';2、装载数据到分区表t12load data local inpath 'data/t8' into ta
原创
发布博客 2015.10.06 ·
8324 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

使用JAVA操作HIVE

一、 首先,在机器上打开hiveservicehive --service hiveserver -p 50000 &打开50000端口,然后java就可以使用java连了,需要的jar包我发个图片二、编写代码package hive;import java.sql.Connection;import java.sql.DriverManager;import
原创
发布博客 2015.10.06 ·
1215 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

更改hive的日志级别

vi  $HIVE_HOME/conf/hive-log4j.properties 找到并修改hive.root.logger属性,如下所示:hive.root.logger=DEBUG,DRFA
原创
发布博客 2015.10.03 ·
5439 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

使用Hive整合Hbase

一、配置1、根据hive的版本去maven仓库找hive-hbase-handler.jar。org.apache.hivehive-hbase-handler0.14.0把下载到的hive-hbase-handler-0.14.0.jar放到hive的lib目录下。附:对hive和hbase的版本要求非常严格,必须要版本匹配才行。如何匹配版本?
原创
发布博客 2015.10.03 ·
979 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

JAVA实现json和对象间的相互转换,支持复杂对象格式

jackson-core-asl-1.9.12.jarjackson-mapper-asl-1.9.12.jarpackage com.psd.test;import java.io.IOException;import java.text.SimpleDateFormat;import java.util.List;import org.apache.commons.
转载
发布博客 2015.09.28 ·
4322 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Nutch入门教程

发布资源 2015.09.25 ·
pdf

Nutch爬虫爬取视频研究文档

一、爬虫框架说明爬虫框架使用Nutch1.7+Solr4.3+Jsoup1.7.1。其中,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。我们主要用它来爬取页面,检索我们用的Solr框架,它的功能比Nutch自带的搜索强大。Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展
原创
发布博客 2015.09.25 ·
2622 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏
加载更多