- 博客(5)
- 资源 (5)
- 收藏
- 关注
原创 Ubuntu下使用Python开发Spark程序
1、安装配置好Spark环境,确认执行Spark目录下的/bin/pyspark能够成功进入。Spark 集群搭建从零开始之1 Scala的安装与配置Spark 集群搭建从零开始之2 Spark单机伪分布式安装与配置Spark 集群搭建从零开始之3 Spark Standalone集群安装、配置与测试2、安装anaconda2https://www.anaconda
2017-12-28 14:44:15 1776
原创 图形数据库Neo4j入门
一、安装官网下载,https://neo4j.com二、Neo4j的查询语言Cypher的基本使用1、CREATE (you:Person {name:"chenjie"}) RETURN you2、MATCH (you:Person {name:"chenjie"}) CREATE (you)-[like:LIKE]->
2017-12-15 21:43:58 1344
原创 消息队列系列之分布式消息队列Kafka
介绍ApacheKafka®是一个分布式流媒体平台。这到底是什么意思呢?我们认为流媒体平台具有三个关键功能:它可以让你发布和订阅记录流。在这方面,它类似于消息队列或企业消息传递系统。它允许您以容错方式存储记录流。它可以让您在发生记录时处理记录流。什么是卡夫卡好?它被用于两大类的应用程序:构建可在系统或应用程序之间可靠获取数据的实时流数据管道构建实时流应用程序
2017-12-03 20:00:11 38516 2
原创 消息队列系列之ActiveMQ(JMS、集群配置)
1、ActiveMQ的下载与启动到http://activemq.apache.org/activemq-5152-release.html下载ActiveMQwindows版本的启动:运行bin文件夹中的win32(32位系统)/win64(64位系统)下的:activemq.bat(直接启动,不能关闭命令行窗口,否则会关闭)InstallService.bat(以服务方
2017-12-03 19:46:45 1845
原创 Flume 日志收集、使用Flume收集日志到HDFS
第一章 概览与架构1.1 源、通道与接收器Flume代理的架构如下图:输入叫做源,输出叫作接收器。通过提供类源与接收器之间的胶水。它们都运行在叫做代理的守护进程中。源将事件写到一个或者多个通道中。通道作为事件从源到接收器传递的保留区。接收器只能从一个通道接收事件。代理可能会有多个源、通道与接收器。1.2 Flume事件Flume传输的基本的数
2017-12-02 18:29:36 6297 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人