自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (3)
  • 收藏
  • 关注

转载 沈从文先生在西南联大(作者汪曾祺)

1939年,汪曾祺考入西南联合大学中文系,从杨振声、闻一多、朱自清诸先生学习,是沈从文先生的入室弟子,沈先生对文学创作有一套自己的看法,并且对汪曾祺日后的创作产生了巨大的影响。《我的老师沈从文》中,汪先生将自己对沈先生的怀念从从容容地挥洒于笔尖,文字很朴素,但是字里行间流淌的都是真情。此文致敬所有在三尺讲台耕耘的“先生”们。     &n...

2019-09-30 23:52:21 2140

原创 钱穆的中学读书事(作者王国华)

      重读国学大师钱穆先生的著作《师友杂忆》,记其中学读书事,越读越感慨。20世纪初,钱穆就读于常州府中学堂。其同学中有一人就是后来的刘半农;有个小他两级的师弟,就是后来的瞿秋白;有个老师,竟是文史大家吕思勉。一个不起眼的学校,走出这么多耀眼的 人,一定有其独到之处。而钱穆记录的几则师生轶事,恰可体现彼时的学风,即:讲规则,有错必...

2019-09-30 23:41:55 223

原创 Flink三种运行模式安装部署

环境Flink 1.8.2jdk 1.8hadoop 2.8.5Local模式在Local模式下仅模拟cluster集群,仅启动JobManager完成应用的运行。JobManager进程信息如下:启动:./bin/start-cluster.sh停止:./bin/stop-cluster.sh提交作业方式./flink run -p 1 ../examples/batch/...

2019-09-30 14:46:08 1908

原创 Apache Flink 读取本地文件,处理数据,导入ES

需求本地有一份文件使用Flink读取本地数据源处理数据,导入ES中提交Flink作业环境Flink :1.8.2Elasticsearch:6.2.3JDK:1.8pom.xml<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0...

2019-09-29 15:56:43 7254

转载 HDFS常用命令

简洁NameNode负责响应客户端请求。负责管理元数据(文件名、副本数、Block存放的DN)。DataNode存储数据。向NameNode发送心跳,汇报本身及Block信息。默认block为128mb。Secondary NameNode监控HDFS状态的辅助后台程序,合并fsimage与edits。fsimage:元数据镜像文件,存储NameNode元数据信息(Second...

2019-09-26 15:49:43 183

原创 Apache Flink 零基础入门(二十一)Flink HistoryServer概述与配置

之前我们做了Flink的开发,开发完成之后就需要进行监控。Flink 有一个History Server可以在相关Flink 集群关闭之后,还可以查看一些信息。也就是一些作业运行完成之后,可以用History Server查看运行的统计信息。同时,还暴露了一些RestAPI,允许http进行请求。修改配置文件conf/flink-conf.yaml:jobmanager.archive....

2019-09-23 16:12:21 1599

原创 Flink分布式standalone部署方式(第二种方式)

接着上面一节中介绍的,浏览器中输入地址http://swarm-manager:8088/cluster,输出如下:拿到application_1569070146084_0001,然后在控制台先kill掉:./yarn application -kill application_1569070146084_0001Run a single Flink job on YARN之前介绍了...

2019-09-23 10:23:25 1082

原创 Flink分布式standalone部署方式(第一种方式)

提前准备java 版本 1.8.0_101flink 版本 flink-1.8.2-bin-scala_2.11.tgzhadoop 版本 hadoop-2.8.5.tar.gzflink-hadoop lib 版本 flink-shaded-hadoop-2-uber-2.6.5-7.0.jar配置环境变量JAVA_HOME=/usr/jdk1.8.0_101FLINK_HOM...

2019-09-21 21:37:09 666

原创 Apache Flink 零基础入门(二十)Flink部署与作业的提交

之前我们都是基于Idea在本地进行开发,这种方式很适合开发以及测试,但是开发完之后,如何提交到服务器中运行?Flink单机部署方式本地开发和测试过程中非常有用,只要把代码放到服务器直接运行。前置条件jdk8maven3下载解压Flink,这里直接下载源码编译,直接从github上下载源码https://github.com/apache/flink/releases 选择1.8.1然...

2019-09-18 18:43:11 512

原创 KMP算法

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...

2019-09-18 01:02:47 184

原创 Apache Flink 零基础入门(二十)Flink kafka connector

内置source和sink内置source包括从文件读取,从文件夹读取,从socket中读取、从集合或者迭代器中读取。内置的sink包括写文件、控制台输出、socket内置connectorsApache Kafka(source/sink) Apache Cassandra(sink) Amazon Kinesis Streams(source/sink) Elastic...

2019-09-16 17:18:00 345

原创 Apache Flink 零基础入门(十九)Flink windows和Time操作

Time类型在Flink中常用的Time类型:处理时间 摄取时间 事件时间处理时间是上图中,最后一步的处理时间,表示服务器中执行相关操作的处理时间。例如一些算子操作时间,在服务器上面的时间。如果你以处理时间作为流处理的时间处理方式,那么所有的基于时间的操作都会使用服务器的时间,来运行相关的操作。例如:一个小时的处理时间窗口,将会包含一个小时内的到达服务器内的所有数据。例如...

2019-09-12 16:45:00 247

原创 Apache Flink 零基础入门(十八)Flink Table API&SQL

什么是Flink关系型API?虽然Flink已经支持了DataSet和DataStream API,但是有没有一种更好的方式去编程,而不用关心具体的API实现?不需要去了解Java和Scala的具体实现。Flink provides three layered APIs. Each API offers a different trade-off between conciseness ...

2019-09-11 17:03:00 396

原创 Apache Flink 零基础入门(十七)Flink 自定义Sink

需求:socket发送过来的数据,把String类型转成对象,然后把Java对象保存到Mysql数据库中。创建数据库和表create database imooc_flink;create table student(id int(11) NOT NULL AUTO_INCREMENT,name varchar(25),age int(10),primary key(id))...

2019-09-11 15:14:00 412

原创 Apache Flink 零基础入门(十六)Flink DataStream transformation

Operators transform one or more DataStreams into a new DataStream.Operators操作转换一个或多个DataStream到一个新的DataStream 。filter functionScalaobject DataStreamTransformationApp { def main(args: Arr...

2019-09-10 19:06:00 171 1

原创 Apache Flink 零基础入门(十五)Flink DataStream编程(如何自定义DataSource)

数据源可以通过StreamExecutionEnvironment.addSource(sourceFunction)方式来创建,Flink也提供了一些内置的数据源方便使用,例如readTextFile(path) readFile(),当然,也可以写一个自定义的数据源(可以通过实现SourceFunction方法,但是无法并行执行。或者实现可以并行实现的接口ParallelSourceFunct...

2019-09-10 17:32:00 657

原创 将博客搬至CSDN

CSDNhttps://blog.csdn.net/vincent_duan

2019-09-10 14:52:00 68

原创 业界流处理框架对比

SparkSpark对于流处理有两大框架:分别是Spark Streaming和结构化流。以离线批处理为主,流式处理是批处理的一个特例,相当于把批处理拆成小的批次(mini batch) ,例如每隔10秒处理一次流式数据。Flink与spark刚好相反,Flink是以处理流数据为主,批处理是流式处理的一个特例。Storm只支持流处理...

2019-09-10 14:51:00 145

原创 Apache Flink 零基础入门(十四)Flink 分布式缓存

Apache Flink 提供了一个分布式缓存,类似于Hadoop,用户可以并行获取数据。通过注册一个文件或者文件夹到本地或者远程HDFS等,在getExecutionEnvironment中指定一个名字就可以。当应用程序执行时,Flink会自动拷贝这个文件或者文件夹到所有worker进程中。用户的Function通过指定的名字可以查找这个文件或者文件夹中的内容。Scaladef m...

2019-09-10 14:43:00 287

原创 Apache Flink 零基础入门(十三)Flink 计数器

需求:当一个文本文件进入时,有可能会有一些格式乱码的错误行,如何统计哪些错误行?如何提取错误行 def main(args: Array[String]): Unit = { val env = ExecutionEnvironment.getExecutionEnvironment val data = env.fromElements("hadoop","spark"...

2019-09-10 11:18:00 1246 5

原创 Apache Flink 零基础入门(十二)Flink sink

将DataSet中的数据Sink到哪里去。使用的是对应的OutPutFormat,也可以使用自定义的sink,有可能写到hbase中,hdfs中。writeAsText() / TextOutputFormat ,以String的形式写入 writeAsCsv(...) / CsvOutputFormat,以CSV的方式写进去 print() / printToErr() / ...

2019-09-10 09:55:00 263

原创 Apache Flink 零基础入门(十一)Flink transformation

前面讲了常用的DataSource的用法,DataSource其实是把数据加载进来,加载进来之后就需要做Transformation操作了。Data transformations transform one or more DataSets into a new DataSet. Programs can combine multiple transformations into soph...

2019-09-05 17:31:00 187

原创 Docker 解决容器时间与主机时间不一致的问题三种解决方案

Docker容器时间与主机时间不一致通过date命令查看时间查看主机时间[root@localhost ~]# date2016年 07月 27日 星期三 22:42:44 CST查看容器时间root@b43340ecf5ef:/#date ...

2019-09-05 15:12:00 1120

原创 SpringBoot指定服务项目名

使用不同SpringBoot版本,指定访问项目路径的项目名,使用的配置也不一样SpringBoot版本 配置 1.x server.context-path=/demo 2.x server.servlet.context-path=/demo 以下为本地测试可行代码pom.xml中使用SpringBoot版本<version>1.5.9.RE...

2019-09-05 15:01:00 3263

原创 docker logs 日志原理

参数说明$ docker logs [OPTIONS] CONTAINEROptions: --details 显示更多的信息 -f, --follow 跟踪日志输出,最后一行为当前时间戳的日志 --since string 显示自具体某个时间或时间段的日志 --tail string 从...

2019-09-05 14:55:00 1431

原创 Apache Flink 零基础入门(十)Flink DataSet编程

DataSet programs in Flink are regular programs that implement transformations on data sets (e.g., filtering, mapping, joining, grouping). The data sets are initially created from certain sources (e.g...

2019-09-04 10:12:00 154

SpringDataJPA入门

SpringDataJPA 入门 用户管理系统

2015-09-02

Android开发效率的Eclipse快捷键.txt

Android开发效率的Eclipse快捷键.txt

2012-12-12

eclipse快捷键

eclipse 一定会用到 txt文档 挺不错

2012-12-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除