王小雷-多面手

专注大数据,人工智能的多面手,对新兴的技术与知识充满了好奇与渴望!

排序:
默认
按更新时间
按访问量

卜算子·大数据简介 一个开源、成体系的大数据学习教程

第1章 卜算子·大数据简介 “卜算子·大数据”,是一个开源、成体系的大数据学习教程。从基础数据采集到顶层架构设计。最新梳理出大数据知识体系共计12个部分,42个章节。 每周日更新,金九银十际,助你上青天! 本章主要内容: 特点 “卜算子·大数据”架构 项目更新 写作目的 原创声明 ...

2018-06-29 11:50:52

阅读数:287

评论数:0

14.4 Spark-SQL基于Cassandra数据分析编程实例

14.4 Spark-SQL编程-PostgreSQL-Cassandra数据分析 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: Spark对Canssandra数据库数据的处理,通过Spark SQL对结构化数据进行数据分析。 创建Gradle项目...

2018-07-15 22:39:39

阅读数:523

评论数:0

14.3 Spark-SQL基于PostgreSQL数据分析编程实例

14.3 Spark-SQL编程-PostgreSQL-Cassandra数据分析 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: Spark对PostgreSQL数据源数据的处理,通过Spark SQL对结构化数据进行数据分析。 创建Gradle项目...

2018-07-15 22:08:35

阅读数:56

评论数:0

14.1 Apache Spark 简介快速入门

14.1 Apache Spark 简介快速入门 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 速度 简单易用 Spark架构 到处运行 多种数据源 14.1.1 速度 百倍的运行速度。 Spark使用先进的DAG调度系统,查询优化器与物理执行...

2018-07-15 22:03:00

阅读数:55

评论数:0

12.6 Cassandra开启远程连接

12.6 Cassandra开启远程连接 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: Cassandra开启远程连接 12.6.1 修改Cassandra配置文件 vim cassandra.yaml 12.6.2 修改如下内容 ...

2018-07-15 21:59:01

阅读数:305

评论数:0

12.5 Cassandra安全配置--密码认证

12.5 Cassandra安全配置–密码认证 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: Cassandra密码模式配置 12.5.1 打开配置文件 vim cassandra.yaml 12.5.2 修改如下内容 aut...

2018-07-15 21:57:39

阅读数:143

评论数:0

12.4 Cassandra数据模型

12.4 Cassandra数据模型 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 没有JOIN操作 Cassandra没有表的连接操作,跟关系型数据库设计相比最好的方式是,反(非)规范化设计,设计为两个表连接后的结果表。 没有参照完整性(外键) 虽然表中可以...

2018-07-08 17:08:05

阅读数:106

评论数:0

12.3 Cassandra数据定义

12.3 Cassandra数据定义 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 数据定义 12.3.1 Cassandra Query Language (CQL) CQL是Cassandra提供的接近SQL的模型,因为数据包含在行列的表中,...

2018-07-08 17:05:16

阅读数:81

评论数:0

12.2 Cassandra安装

12.2 Cassandra安装 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 安装Canssandra 下载、解压、移动Cassandra wget https://mirrors.tuna.tsinghua.edu.cn/apache...

2018-07-08 16:59:17

阅读数:89

评论数:0

7.2 Sqoop2示例数据从PostgreSQL导入到HDFS

7.2 Sqoop2示例数据从PostgreSQL导入到HDFS “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 创建源数据PostgresSQL表与目标数据文件 设置Sqoop2 server 创建HDFS link,jdbc link 创建job,执...

2018-07-08 16:57:30

阅读数:151

评论数:0

7.2 Sqoop2安装

7.2 Sqoop2安装 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: Sqoop2环境变量设置 Sqoop2配置文件修改 Sqoop2数据库初始化与验证 开启Sqoop2 关闭Sqoop2 在此之前已经部署好Hadoop(伪分布式或者完全分布式)...

2018-07-08 16:51:15

阅读数:55

评论数:0

4.2 ApacheAvro编程Java示例

4.2ApacheAvro编程Java示例 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 创建Gradle项目、创建Avro模式 使用Avro命令行工具生成Java代码 不使用Avro命令行工具生成Java代码 4.2.1 创建Gradle项目、创...

2018-07-08 16:47:05

阅读数:75

评论数:0

4.1 数据存储格式

4.1 数据存储格式 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 Avro是一个序列化系统。 特点: 支持丰富的数据结构 紧凑、快速的二进制数据格式 持久化存储的容器文件 远程过程调用(RPC) 动态语言的简单集成 下载 https://mirrors.tu...

2018-07-08 16:43:33

阅读数:55

评论数:0

2.5 Linux(Ubuntu18.04)安装数据库PostgreSQL

2.5 Linux(Ubuntu18.04)安装数据库PostgreSQL “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 创建一台database虚拟机(本章称为服务器) 安装PostgreSQL 2.5.1 创建Database服务器Ubuntu...

2018-07-08 16:41:08

阅读数:83

评论数:0

2.4 Hadoop伪分布式快速部署

Hadoop伪分布式快速部署 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 依赖安装、免密登录 安装Java 伪分布式——Hadoop MapReduce配置 配置Hadoop环境变量 伪分布式——Hadoop MapReduce开启 伪分布式——YA...

2018-07-08 16:32:49

阅读数:61

评论数:0

2.2Virtualbox高级应用构建本地大数据集群服务器

2.2 Virtualbox高级应用构建本地大数据集群服务器 “卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新 本节主要内容: 创建4台虚拟机(本章中称虚拟机亦称服务器)分别命名为(busuanzi.org,master,worker1,worker2) 设置Host-o...

2018-07-08 16:23:24

阅读数:57

评论数:0

2.3 基于IDEA开发第一个MapReduce大数据程序WordCount

2.3 基于IDEA开发第一个MapReduce大数据程序WordCount 开源地址 https://github.com/wangxiaoleiAI/big-data 卜算子·大数据 目录 开源“卜算子·大数据”系列文章、源码,面向大数据(分布式计算)的编程、应用、架构——...

2018-06-24 15:02:22

阅读数:196

评论数:0

Ubuntu18.04主题更换为 Mac OS high Sierra美化教程与Mac book pro键盘问题

Ubuntu18.04完全美化教程 Ubuntu18.04主题更换为 Mac OS high Sierra 昨天MBP去换键盘…需要一周左右(2017MBP键盘真的不敢恭维…我居然能把空格键给敲塌陷了,敲的代码有那么多吗…),所以这几天赶紧启用另一个thinkpad(离开计算机如同废人的我…),...

2018-06-24 10:56:19

阅读数:1413

评论数:1

2.2 Hadoop3.1.0完全分布式集群配置与部署

2.2 Hadoop3.1.0完全分布式集群配置与部署 开源地址 https://github.com/wangxiaoleiAI/big-data 卜算子·大数据 目录 开源“卜算子·大数据”系列文章、源码,面向大数据(分布式计算)的编程、应用、架构——每周更新!Linux、...

2018-06-20 20:50:19

阅读数:549

评论数:0

1.3 virtualbox高级应用构建本地大数据集群服务器

1.3 virtualbox高级应用构建本地大数据集群服务器 开源地址 https://github.com/wangxiaoleiAI/big-data 卜算子·大数据 目录 开源“卜算子·大数据”系列文章、源码,面向大数据(分布式计算)的编程、应用、架构——每周更新!Lin...

2018-06-20 13:29:09

阅读数:293

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭