2017年05月_mtj66

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client

Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client needs one of these to be set to properly load the Hadoop configuration for accessing YARN.Ple

2017-05-25 09:53:09 7044 1

原创 Hbase WAL 机制记录

Write-Ahead-Log（WAL）该机制用于数据的容错和恢复：每个HRegionServer中都有一个HLog对象，HLog是一个实现Write Ahead Log的类，在每次用户操作写入MemStore的同时，也会写一份数据到HLog文件中（HLog文件格式见后续），HLog文件定期会滚动出新的，并删除旧的文件（已持久化到StoreFile中的数据）。当HRegionS

2017-05-22 15:44:44 897

原创 Spark VS Flink

转自：http://data-flair.training/blogs/comparison-apache-flink-vs-apache-spark/ Spark is considered as 3G of Big Data, whereas Flink is as 4G of Big Data (在流处理方面我同意这个结论).1. Objective

2017-05-15 15:20:38 750

原创 HadoopMR vs Spark vs Flink 特性对比

看了下flink，然后找到了一篇对比文章，但是这篇文章的作者是偏向于flink的，有些对比，我们就看看，不说话。个人认为spark是批处理的老大，flink是流式处理的老大。至于表处理，spark也是不落下，列式存储parquet以及列式数据集dataFrame，以及执行计划的自动优化使得数据的处理性能，和hive2 Tenz / impala有点一拼，但是掌握spark技术栈，可以应付绝

2017-05-15 14:56:02 2339

逆地理编码离线版-精度到乡镇街道

传入经纬度，解析出地址信息，性能:4ms/条地址精度到乡镇街道，包含城市等级，精度满足一般的需求，如对精度要求极高请勿下载

2022-07-01

useragent解析逻辑&手机品牌匹配.txt

在对浏览界面进行解析获取用户信息的过程中，想要精准识别用户，对useragent解析&手机品牌匹配是必不可少的环节，本文档提供了解析逻辑，以及提供了最新的手机品牌和useragent对应的文件，帮你丰富用户画像，以及作为模型特征因子。

2021-11-22

windows服务器python程序部署文档.doc

如果在window服务器中部署python程序呢？本文有部署流程指导：从安装到定时任务的创建

2021-11-15

shakespeare.json&logs;.jsonl.gz&accounts;.zip

官网原始链接失效该压缩文件已经打包上传，提供大家测试使用。 shakespeare.json&logs;.jsonl.gz&accounts;.zip

2018-01-10

kafka-manager 1.3.3.15

已经编译好的 kafka-manager 1.3.3.15 具体使用可以参考 https://github.com/yahoo/kafka-manager

2018-01-08

中文版，提供百度网盘下载。本书作者：Ralph Kimball博士主要介绍本书从维度建模的基本知识入手，通过给出零售、库存、采购、订单管理、顾客关系管理、账目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究，全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时，本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。本书先介绍基本知识，然后逐个讨论具体实例内容，最后进行综合总体分析，在内容的结构方面很有特色。本书涉及的行业较多，但这些内容从不同角度体现了数据仓库的各个方面，因而对于完整的学习与掌握数据仓库知识显得十分必要。仅供学习使用，切勿商业用途。

2017-10-16

数据仓库工具箱维度建模权威指南第3版

数据仓库工具箱维度建模权威指南第3版本书主要介绍本书从维度建模的基本知识入手，通过给出零售、库存、采购、订单管理、顾客关系管理、账目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究，全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时，本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。本书先介绍基本知识，然后逐个讨论具体实例内容，最后进行综合总体分析，在内容的结构方面很有特色。本书涉及的行业较多，但这些内容从不同角度体现了数据仓库的各个方面，因而对于完整的学习与掌握数据仓库知识显得十分必要。

2017-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

mtj66的博客，交流WX:SpringBreeze1104

原创 Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client

原创 Hbase WAL 机制记录

原创 Spark VS Flink

原创 HadoopMR vs Spark vs Flink 特性对比

逆地理编码离线版-精度到乡镇街道

useragent解析逻辑&手机品牌匹配.txt

windows服务器python程序部署文档.doc

T+0操作方法与技巧.pptx

shakespeare.json&logs;.jsonl.gz&accounts;.zip

kafka-manager 1.3.3.15

百度网盘数据仓库工具箱维度建模权威指南第3版全

数据仓库工具箱维度建模权威指南第3版

Tensorflow 实战Google深度学习框架

IDEA 创建scala工程并打指定的依赖包

高德地图POI类型表

常用数据挖掘算法总结及Python实现

hbase自定义Comparator进行数值比较

百度云存储LBS

创建单个分区的window虚拟机

空空如也

原创 Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client

原创 Hbase WAL 机制记录

原创 Spark VS Flink

原创 HadoopMR vs Spark vs Flink 特性对比

逆地理编码离线版-精度到乡镇街道

useragent解析逻辑&手机品牌匹配.txt

windows服务器python程序部署文档.doc

T+0操作方法与技巧.pptx

shakespeare.json&logs;.jsonl.gz&accounts;.zip

kafka-manager 1.3.3.15

百度网盘 数据仓库工具箱 维度建模权威指南 第3版 全

数据仓库工具箱 维度建模权威指南 第3版

Tensorflow 实战Google深度学习框架

IDEA 创建scala工程并打指定的依赖包

高德地图POI类型表

常用数据挖掘算法总结及Python实现

hbase自定义Comparator进行数值比较

百度云存储LBS

创建单个分区的window虚拟机

空空如也

百度网盘数据仓库工具箱维度建模权威指南第3版全

数据仓库工具箱维度建模权威指南第3版