自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

认知 行动 坚持

深耕大数据技术,关注数据结构、算法、底层源码、技术架构、设计模式,挖掘大数据应用价值。热爱软件,喜欢编程的阳光小伙子~

  • 博客(11)
  • 资源 (35)
  • 收藏
  • 关注

原创 使用hive、java api两种方式实现wordcount功能、及个人感悟

使用hive、java api两种方式实现wordcount功能、及个人感悟

2017-06-30 17:28:59 1326

原创 Hive UDF实操及解析说明

hive类UDF工作原理要继承org.apache.hadoop.hive.ql.exec.UDF类,实现evaluate方法代码如下:package cn.itcast.hive.udf;import java.util.HashMap;import java.util.Map;import org.apache.hadoop.hive.q

2017-06-29 17:59:24 1434

原创 hive安装过程全程解析、hive常规操作、说明

hive安装过程全程解析、hive常规操作、说明

2017-06-29 17:58:56 1298 1

原创 sqoop数据库迁移工具——实操

sqoop实操:数据迁移工具sqoop主要用于hadoop(Hive)与传统数据库mysql间进行数据的迁移

2017-06-28 19:23:02 458

原创 超详细zookeeper集群搭建及解析说明

超详细zookeeper集群搭建及解析说明

2017-06-28 19:19:40 1622

原创 个人超全hbase集群搭建过程!!!

个人超全hbase集群搭建过程!!!

2017-06-28 19:18:44 5317

原创 hase伪分布式搭建过程及说明

搭建单节点hbase(伪分布式)及简介

2017-06-28 19:17:33 599

原创 hadoop集群查看进程情况【超实用】

hadoop集群查看进程情况

2017-06-28 19:16:43 10354 4

原创 hadoop集群停止脚本

解决停止hadoop集群时,效率低问题当搭建好了hadoop集群时,启动hadoop集群后,需要停止集群工作,需要先停止yarn,需要停止hdfs,需要停止zookeeper,很麻烦呀,效率太低了,有木有!!!!!!!!!!

2017-06-28 19:14:28 1227

原创 hadoop集群启动脚本——解决启动hadoop集群时,效率低问题

解决启动hadoop集群时,效率低问题当搭建好了hadoop集群时,需要先启动协调zookeeper,再启动hdfs,最后启动yarn,很麻烦呀,效率太低了,有木有!!!!!!!!!!

2017-06-28 19:12:11 1243

原创 hadoop集群搭建

事先说明一下哈,我这一个hadoop集群搭建,是参考视频教学搭建而来的。 hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等,所以我们这一次搭建时使用hadoop 2.2.0版本。注意:apache提供的hadoop-2.2.0的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hadoop-2.2.0就需要重新在64操作系统上重新编译(建议第一次安装用32位的系统,我将编译好的64位的也上传到群共享里了,如果有兴

2017-06-28 19:07:20 1114 2

Java集合思维导图.xmind.zip

详细描述了Java提供的集合类:HashMap/CurrentHashMap/ArrayList/LinkedList核心原理及版本升级差异。

2020-09-13

Spark 机器学习.xmind.zip

MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且容易,思维导图中详细地描述了Spark ML机器学习库相关的技术点及使用示例

2020-09-13

Titanic_SparkMl_Train.csv

预测Titanic 号上的乘客生存概率,是一个二分类问题,所以我们可以使用二分类来分解。通过Spark 机器学习库中线性SVM 、Logistic回归、决策树、随机森林、梯度提升树来预测。

2020-09-13

算法思维导图【全面】.xmind.zip

总结常规排序算法:选则、冒泡、插入、希尔、归并、快排、桶排序等,涵盖:设计思想、时间复杂度、空间杂度度、稳定性、使用场景、代码示例等。

2020-09-07

Synchronized_思维导图(全面).xmind.zip

从思维导图的角度将 Java 关键字 Synchronized进行分析整理,含盖CAS、偏向锁、轻量级锁、重量级锁及锁升级,同时附加了常见问题整理

2020-08-22

Flink_思维导图(干货).xmind.zip

超级干货--Flink思维导图,花了3周左右编写、校对。里面含有Flink核心技术,比如StateBackEnd,CheckPoint,消费语义、Window操作、两阶段提交等核心要点。前前后后校对过多次,欢迎交流

2020-07-18

RPC研究,从浅到深,含研究笔记:超级全面,包懂

RPC研究,从浅到深,含研究笔记:超级全面,包懂。代码分等级,从最简单的socket通信,到通过代理获取;再到动态代理;代理接口不暴露;以及序列化方式对比;以及大数据框架下的rpc通信应用。自己整理了很久,超值!

2020-07-18

HDFS文件系统JAVA api访问接口(基于hadoop大数据平台)

在搭建完hadoop大数据系统(CDH5.16.1)后,如何访问hdfs文件系统上的数据呢?那当然是通过构建maven项目 使用java api接口进行文件了。为此,特别进行了hdfs文件系统java api访问的整理。

2019-06-11

MYSQL视频资料链接,百度网盘下载

主要是数据库理论的讲解,授课老师基本讲解了mysql数据库的知识点

2018-11-27

图解Spark核心技术与案例实战

本书以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark 生态圈相关组件,包括了Spark SQL 的即席查询、Spark Streaming 的实时流处理应用、MLbase/MLlib 的机器学习、GraphX 的图处理、SparkR 的数学计算和Alluxio 的分布式内存文件系统等。

2018-11-15

C#版使用Halcon图像显示,PhotoDemo

我是使用VS2013版,Halcon12版本加载本地图片并进行灰度处理显示。另外示例提供了笔记本摄像头实时采集功能。欢迎交流分享

2018-10-20

Hdevelop基础函数接口API说明

Hdevelop基础函数接口API说明,对于新手可快速熟悉Halcon相关的API接口。实用性高

2018-10-17

halcon学习网下载资料供大家学习

需要学习halcon的技术小伙,不防下载《halcon学习网下载资料供大家学习》,里面提供有相关的halcon技术文档的文档

2018-10-12

hadoop 默认配置大全

core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml

2017-07-02

HIVE 编程指南

HIVE 编程指南

2017-06-30

MySQL必知必会

《MySQL必知必会》MySQL是世界上最受欢迎的数据库管理系统之一。书中从介绍简单的数据检索开始,逐步深入一些复杂的内容,包括联结的使用、子查询、正则表达式和基于全文本的搜索、存储过程、游标、触发器、表约束,等等。通过重点突出的章节,条理清晰、系统而扼要地讲述了读者应该掌握的知识,使他们不经意间立刻功力大增。

2017-06-29

hadoop-2.2.0-src.tar.gz

hadoop2.2.0源码分享

2017-06-26

Apache Druid 3台集群搭建,可用配置 druid_conf.zip

通过imply 来安装Apache Druid集群。因配置项较多,个人也反复比对校验过,将个人配置 imply-3.0.4可用的配置进行分享。先将imply_home下的conf进行备份,可解压至imply_home/下即可使用。需要确认一下zk、集群节点hostname、mysql等信息。

2020-12-20

logback-core 和logback-access 1.2.3.zip

logback-access 的使用,如果将tomcat 默认的日志输出换成logback,则需要提供这两个jar 包。将logback-access.jar 与 logback-core.jar 复制到 $TOMCAT_HOME/lib/目录下

2020-12-06

MySQL 精简50题练习 school_score.sql

对MySQL数据分析练习的精简小结,包含:一、数据表信息;二、创建数据库、表、填充信息;三、精简50题 及 参考答案。此外,加入了实际项目中部分的小结。非常适合熟悉MySQL的小伙伴。同时,不需要积分即可下载。是不是很给力!

2020-11-14

大数据资料之ClickHouse.pdf

ClickHouse概述、安装、数据类型、表引擎、SQL语法。相对比较简洁汇总的一个文档,适合于入门学习整理。

2020-11-11

mysql 练习【超级适用】

MySQL 这些知识要搞懂才行【精简总结】—— 配套 mysql 脚本。容易、简单,非常适合学习、开发人员入手。

2020-10-27

Java后端开发学习路线.xmind

Java后端开发学习路线:编程基础、数据结构与算法、计算机网络、SQL/数据库、操作系统、设计模式、研发工具、应用框架、运维知识、成神之路、平稳降落。

2020-10-24

大数据技术之高频面试题.pdf

涵盖面试说明、手写代码、项目架构、项目涉及技术、用户行为数据、业务交互数据、项目中遇到哪些问题、项目经验、JavaSE技术、Redis、MySQL、JVM、JUC、模拟考试。真的是非常全面的精华资料。

2020-09-22

ElasticSearch 思维导图.xmind.zip

全面描述ElasticSearch技术,涵盖:插入数据、版本控制、Mapping 、Query查询【数据准备】、Filter查询【数据准备】、aggs聚合查询、组合查询/复合查询、ElasticSearch原理、JAVA API操作ES、实用技能。是我本人整理校对的思维导图,真心不错

2020-09-20

hbase-思维导图.xmind.zip

全面描述大数据列式存储HBase知识,涵盖概念、架构、工作原理、Hbase优化、读写流程、系统优化等方面。本思维导图内容全面,同时对Flush、compaction工作原理进行深度总结。是个非常不错的资源!

2020-09-20

MySQL_思维导图(全面).xmind.zip

资源包括:1、mysql的架构介绍;2、索引优化分析;3、查询优化分析;4、mysql锁机制;5、主从复制;以及如何建立高效的索引、索引在哪些情况下会失效、生产环璋下,如果进行sql问题排查及优化。属于非常干货的内容。

2020-09-13

Hbase总结.docx

资源回答:Rowkey设计时需要遵循三大原则?你们在使用hbase在使用遇到的问题?Hbase优化,你们是怎么做的?Hbase热点(数据倾斜)问题你们是怎么处理的?属于高频面试题

2020-09-13

Kafka总结.docx

资源回答:Kafka 介绍、Kafka常见问题及如何处理?Kafka优化你们是如何做的?Kafka 的 Follower与Leader同步消息是如何进行的?Kafka 的ISR中有follower落后,怎么处理?属于高频面试题,拿走不谢!

2020-09-13

JVM总结.docx

资源回答:HotSpot的垃圾收集器最常用有哪些?平时开发遇到oom?怎么分析oom?出现OOM问题多方面的原因有哪些?属于高频面试题

2020-09-13

Java 线程池.docx

资源回答:为什么需要线程池?常见的线程池有哪几个种?线程池的核心参数有哪几个?线程池的核心原理?线程池的拒绝策略。属于高频面试题

2020-09-13

Flink总结.docx

资源回答了:什么是Flink?Flink 相比传统的 Spark Streaming 有什么区别?Flink恰巧语义一次消费,怎么保证?flink反压机制知道么?

2020-09-13

TCP&SOCKET&三次握手全解.xmind.zip

TCP&SOCKET&三次握手全解,详细描述通信示例;传输控制层、网络层、链路层。对于学习网络通信相关技术有较大帮助,相信通过思维导图的方式更清晰展示网络通信相关技术点。

2020-09-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除