自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(213)
  • 资源 (26)
  • 收藏
  • 关注

原创 Linux下知道程序运行端口查找程序运行路径

查询端口对应的PIDnetstat -antlp|grep 37799记过如下:tcp 0 0 0.0.0.0:37799 0.0.0.0:* LISTEN 7618/java然后切换目录到/proc/7618对应的目录下 ll -tr 结果如下:exe -> /mnt/disk2/soft/F...

2019-10-09 14:21:49 451

原创 Mac 上使用virtualenv搭建的虚拟环境指定镜像源下载python包

pip install -i https://pypi.douban.com/simple/ torch torchvision

2019-09-03 13:27:55 401 1

原创 pip instal opencv-python超时

pip install -i http://pypi.douban.com/simple --trusted-host pypi.douban.com opencv-python

2019-08-21 11:28:03 1574

原创 Java日期格式化

字母 含义 示例y 年份。一般用 yy 表示两位年份,yyyy 表示 4 位年份 使用 yy 表示的年扮,如 11;使用 yyyy 表示的年份,如 2011M 月份。一般用 MM 表示月份,如果使用 MMM,则会根据语言环境显示不同语言的月份 使用 MM 表示的月份,如 05;使用 MMM 表示月份,在 Locale.CHINA语言环境下,如“十月”;在 Locale.US语言环境下...

2019-07-10 17:13:00 952

原创 druid.io值kafka-index-service任务失败异常排查

2019-06-19T03:44:02,711 INFO [task-runner-0-priority-0] io.druid.indexer.HadoopDruidIndexerJob - No metadataStorageUpdaterJob set in the config. This is cool if you are running a hadoop index task, ot...

2019-07-10 13:21:34 1169

原创 记一次Flink checkpoint超时问题的排查

最近在做Flink实时自定义报表,在临近上线的时候,在测试的过程中,运行一段时间后,发现Flink的checkpoint经常会超时导致数据计算延迟甚至会导致组中Flink程序挂掉.由于这个程序在之前是运行了比较长的一段时间的,并没有报出问题,所一并没有怀疑到是程序本身的问题,最终经过修改测试,所以浪费了较多的时间,经过多方面测试,最终在查看代码的过程中,发现我每个窗口中存在一个查询SQL跟新配置...

2019-07-10 11:47:11 3872 2

原创 记一次Flink程序运行数天之后,某个TaskManger丢失的问题排查

2019-07-05T10:52:13,050 ERROR [flink-akka.remote.default-remote-dispatcher-5] org.apache.flink.runtime.rest.handler.legacy.TaskManagerLogHandler - Fetching TaskManager log failed.java.util.concurrent...

2019-07-10 11:30:06 3966

原创 FlinK运行一段时间后任务任务自己挂掉的问题排查

最近在做自定义实时报表,由于在前期测试Flink发现Flink拥有比较好的性能,并且天然支持窗口,所以在实时计算的时候,我们选择Flink在做计算框架.在所有的代码完成,代码准备上线的时候,发现Flink程序运行一段时间后,要么自己直接挂掉要么过一段时间,程序从checkpoint恢复.在排查日志的过程中,程序中并没有什么异常报出,最终排查每个taskManager的日志发现在其中一个TaskMa...

2019-07-10 11:17:16 16716

原创 druid.oi之ZeroCopyByteBuffer

druid.oi之ZeroCopyByteBuffer

2019-05-28 11:13:00 153

转载 数学建模的推荐书籍

一、掌握建模必备的数学基础知识(如初等数学、高等数学等),数学建模中常用的但尚未学过的方法,如图论方法、优化中若干方法、概率统计以及运筹学等方法。二、,针对建模特点,结合典型的建模题型,重点学习一些实用数学软件(如 Mathematica 、Matlab、Lindo 、Lingo、SPSS)的使用及一般性开发,尤其注意同一数学模型可以用多个软件求解的问题。例如, 贷款买房问题: 某人贷款8 万...

2019-05-28 10:17:16 15224

原创 Java回调实现

首先要定义一个回调方法的接口:public interface CallBackListener { /** * 回调通知函数 */ void callBackNotitify(String msg);}然后需要定义一个调用函数,用于异步调用某个方法:public class Caller { private CallBackListener ...

2019-05-15 17:41:50 198

原创 Flink异常问题提总结

Flink在执行过程中突然异常退出Sink: time-kafka(1/1) switched to SCHEDULED04/29/2019 10:10:20 Job execution switched to status FAILING.org.apache.flink.runtime.jobmanager.scheduler.NoResourceAvailableExcepti...

2019-04-29 14:30:09 13568 1

原创 pydruid的requirements.txt

pydruidprompt-toolkit-1.0.15pygments-2.3.1tabulate-0.8.3

2019-04-23 14:21:32 229

原创 mac下使用HomeBrew更改python版本

早上突然发现自己mac环境下的python3.6创建的虚拟环境无法使用了,报下面的错误/Users/icsoc/.virtualenvs/ctirandomdatatest/bin/python /Users/icsoc/work/code/bi-python/alert_check/check.pydyld: Library not loaded: @executable_path/../....

2019-04-23 09:55:34 10251

原创 mysql批量更新某个字段

update druid_segments set payload = replace(payload,‘oss://icsoc-emr-hadooposs://icsoc-emr-hadoop/druid-test/segments/TEST-CTI-PT30M-PT1H/’,‘oss://icsoc-emr-hadoop/druid-test/segments/TEST-CTI-PT30M-...

2019-03-22 14:51:33 1386

原创 druid.oi之Group BYJSON查询语法

{ "queryType": "groupBy", "dataSource": "DEV-MONITOR-PT1S-PT1H", "threshold": 10, "dimension": "trunkNum", "granularity": "minute", "filter": { "type": "selector", ...

2019-03-22 13:44:02 844

原创 druid.io之merge task

在开发过程中,由于刚刚使用druid.io时,数据量比较小,所以如果按照小时来存储结果,发现每个segments只有几兆的大小,这种大量的小文件不适合在HDFS集群上进行深度存储,同时也会降低查询性能等等,所以迫切需要一种方案对segment进行数据合并,在查询druid.io的配置参数时,发现druid.io的协调节点上可以开启参数druid.coordinator.merge.on每隔一点...

2019-02-26 14:37:33 1047

原创 druid.io数据迁移

在druid.io的开发过程中,遇到需要将druid.io的某个dataSource数据迁移到另外一个集群的问题,在开发过程中,发现一种解决方式,其具体实步骤如下:第一步:将需要迁移的dataSource的segment复制一份到另外一个druid.io集群的segment存储目录下,我们是存在OSS目录下的, 所以可以使用OSS的工具复制到新目录就可以了.第二步:将老druid.io集群上的...

2019-02-22 17:01:08 1250 2

原创 Avro在HDFS中的追加实现

在HDFS上写入Avro文件的实现如下:第一步:需要定义写入到文件的scheme private static final String SCHEMA_JSON = "{\"type\": \"record\",\"name\": \"SmallFilesTest\" ,\"fields\":[{\"name\":\"vccId\",\"t

2019-02-15 10:06:24 794 1

原创 java接口在1.8.0中新增了default关键字

今天在看druid.io的源码的时候,发现在接口中竟然可以是用default关键字,并且可以在接口中实现方法体.查询资料发现default是JDK1.8中新增的,这种发破了原来java对接口语法的闲置.public interface Jobby { boolean run(); /** * @return A map containing statistics fo...

2019-02-14 14:59:09 648

原创 pytest安装并且生成好看的HTML报告

第一步:(1)单独建立一个python环境:mkvirtualenv pytest --python=python3(2)执行命令,切换python工作环境为pytest第二步:直接安装pythest模块到新环境中:pip3 install pytest第三步:安装allure:brew install allure第四步:安装allure-pytestpip install a...

2019-01-31 15:50:42 2131

原创 FlinkSQL读取kafka些消息,并且对消息计数实现

import com.alibaba.fastjson.JSONimport net.icsoc.report.CtiReportRealTime.Messageimport org.apache.flink.api.common.restartstrategy.RestartStrategiesimport org.apache.flink.api.common.typeinfo.Type...

2019-01-14 19:46:26 2547

原创 Redis分布式锁实现数据写入幂等性

程序简要设计Flink时间窗口计算将计算结果写入Druid.io的拓补图结构如下:Flink从kafka消费数据,进行分别进行计量和及时的计算,最终将计算结果写入到kafka,最终druid.io使用kafka-inex-service从kafka中拉取数据,将结果写入到Druid.io程序中的问题在程序运行的过程中,由于非常偶然的原因,Flink程序异常了,然后Flink从最近的che...

2018-12-19 17:52:17 3184

原创 Druid.io之数据压缩任务实现

压缩JSON:{ "type": "compact", "dataSource": "ctitest-20181205", "interval": "2018-01-01/2019-01-01"}压缩任务提交的命令: curl -X 'POST ' -H 'C

2018-12-17 18:37:24 730

原创 Superset修改时区为"Asia/Shanghai"

1.找到superset的安装目录;ps -ef|grep superset 找到superset的安装目录2.进入安装目录下的找到config.py文件,修改入选DRUID_TZ = tz.tzutc() 为DRUID_TZ = tz.gettz(‘Asia/Shanghai’)即可这样superset的时区就切换到东八区了....

2018-12-11 18:18:26 4809 1

原创 Druid.io支持粒度如下:

all:none:使用索引的粒度,最小值none指毫秒粒度second:秒粒度minute:分钟粒度fifteen_minute: 15分钟粒度thirty_minute: 30分钟粒度hour:小时粒度day:天粒度week:周粒度month:月粒度quarter: 一个季度粒度year:年粒度...

2018-12-11 18:12:42 963

原创 kafka-index-service实现一个topic多个不同查询粒度的kafka-index-service任务

在Druid.io相关需求开发的时候,通过大数据Flink实时计算后的结果数据写入到的kafka的topic中,由于需要不同的查询的粒度的的dataSource来有话我们的业务以及查询而不想部署多态Flink程序,因此这是就可以使用该方法实现一份计算,多查询粒度的datasource生成,只需要修改consumerProperties中的goup.id的值即可,以下是我在工做种的实时使用,记录一下...

2018-12-11 16:07:15 833

转载 CentOS使用virtualenv搭建独立的Python环境-python虚拟环境

CentOS使用virtualenv搭建独立的Python环境-python虚拟环境virtualenv可以搭建虚拟且独立的python环境,可以使每个项目环境与其他项目独立开来,保持环境的干净,解决包冲突问题。一、安装python可-编译安装;可-yum安装二、安装virtualenvyum源安装:yum install python-virtualenvvirtualenv实际上...

2018-10-28 14:40:20 2769

转载 GitHub C 和 C++ 开源库的清单(含示例代码)

内容包括:标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++标准库,包括了STL容器,算法和函数等。C++ Standard Library:是一系列类和函数的集合,使用核心语言编写,也是C++ISO自身标准的一部分。Standard Template Library:标准模板库C POSIX library : POSIX系统的C标准库规范I...

2018-10-25 10:45:49 784 1

原创 Java List排序问题

2018-10-19 17:10:05 595

转载 InfluxDB v1.6.3 部署

InfluxDB v1.6.3OS X (via Homebrew)brew updatebrew install influxdbDocker Imagedocker pull influxdbUbuntu & Debian SHA256: cd2e150c69dfdf715501deef1bfb42e6c637e9cccdac14a7d762d23a921b4fc8wg...

2018-10-12 16:09:41 587

原创 python 安装superset问题Was unable to import superset Error: markdown() takes 1 positional argument but 2

运行代码:$ pip install "markdown<3.0.0" superset即可

2018-09-27 14:03:25 2659 1

原创 druid问题

java.lang.IllegalStateException: Failed to create merged beam: druid:overlord/ctitest-20180911 at com.metamx.tranquility.beam.ClusteredBeam$$anonfun$sendAll$2$$anonfun$26.apply(ClusteredBeam.scala:38...

2018-09-18 13:25:08 989

原创 Flink 框架下scala与java混合编程问题

最近在应用Flink做相关业务设计,使用scala与java的混合编程,遇到一些问题,在这里做个记录.问题1:Error:(85, 23) value foreach is not a member of java.util.ArrayList[com.icsoc.report.model.Message[_]] for (msg <- messages) {这...

2018-09-17 19:25:56 6767 1

原创 Flink 实现实时计数和按窗口计时功能程序设计

最近在开发程序的时候,有需要实时的计数处理,以及需要按照设计的窗口来补时长,在要求选用Flink处理后,程序大致架构设计入下: 其设计思路为:从kafk读取数据生成DataStream[Message]这样一个中间变量,然后将这个中间流分两个流,一个流用于实时计数,另一个流,按照互动窗口,按照EventTime将消息划分到不同的窗口,然后取出整个窗口的数据以及取出历史数据,形成完整窗口的数据,惊...

2018-09-17 18:35:06 6529

原创 scala与java混合编程打包pom.xml

pom的build部分: <build> <pluginManagement> <plugins> <plugin> <groupId>net.alchim31.maven</groupId> <artifactId>scala-

2018-09-17 15:11:19 769 1

原创 tranquilizer实现BeamFactory流式数据写入到Druid

package com.icsoc.report.druid;import com.google.common.collect.ImmutableList;import com.metamx.common.Granularity;import com.metamx.tranquility.beam.Beam;import com.metamx.tranquility.beam.Clust...

2018-09-17 15:08:44 676 1

转载 java 接口的坑

在interface里面的变量都是public static final 的。所以你可以这样写: public static final int i=10; 或则 int i=10;(可以省略掉一部分)注意在声明的时候要给变量赋予初值解释:首先你要弄清接口的含义.接口就是提供一种统一的’协议’,而接口中的属性也属于’协议’中的成员.它们是公共的,静态的,最终的常量.相当于全局常量...

2018-08-25 12:17:56 200

原创 Object.clone的坑

Object.clone只能克隆基本类型,如果里面包含其他的Object的,那么其对象还是只想原来的引用.所以在Clone的时候,内部对象也要克隆,否则就容易出bug/******************************************************************************* * 版权信息:北京中通天鸿武汉分公司 * @author xuc...

2018-08-23 20:05:35 450

原创 joda-time中Intervals,Duration,Period的使用

先贴代码,之后再补理解:package net.icsoc.cti.report;import org.joda.time.*;/******************************************************************************* * 版权信息:北京中通天鸿武汉分公司 * @author xuchang * Copy...

2018-08-23 19:38:44 3083

griffin 0.7.0发布包

griffin 0.7.0 发布 打包 成品包

2022-03-29

Phonix性能调研.docx

Phonix对于过滤查询特定少量数据的性能是非常搞笑的在10ms级别,但是在做一个Group BY等等大量数据操作的时候,性能会极大的降低,性能不是很好,如果想从大量数据中查询少量数据集的时候,比较合适,而且可以直接使用SQL分页,能够很好的处理大量数据的问题,做聚合操作,性能还是稍微有些弱,无法满足实时聚合查询的需求.

2019-11-22

Druid-Lookups.postman_collection.json

druid.io的lookups是druid.io之中的很好用的功能,他可以给druid.io的数据源的维度提供额外的关联信息,以帮助druid.io显示更友好,以及开发聚合更方便,减少druid.io的存储,提高druid.io的查询效率

2019-06-05

druid.io数据迁移sql

druid.io新旧集群数据迁移的实现,该脚本就是在druid.io数据迁移过程中会使用到的脚本

2019-03-25

Druid实时大数据分析

Druid实时大数据分析,主要讲的是Druid的使用以及Druid如何与其他大数据插件之间关系

2018-04-10

学习资源Google收藏夹

各个学习资源的网址,官网等等,可以直接导入Google收藏夹,查看各学习项目分类。

2018-03-05

hive-site.xml

hive+mysql配置文档,需要修改的配置,以及配置的要求

2018-01-16

java虚拟机学习

java虚拟机学习 java虚拟机学习java虚拟机学习java虚拟机学习java虚拟机学习

2017-12-21

java基础学习

java基础 书籍 java基础 书籍 java基础 书籍 java基础 书籍 java基础 书籍 java基础 书籍 java基础 书籍 java基础 书籍

2017-12-21

机器学习书籍

机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍 机器学习 书籍

2017-12-21

高等数学相关书籍

高等数学 书籍高等数学 书籍高等数学 书籍高等数学 书籍高等数学 书籍高等数学 书籍高等数学 书籍

2017-12-21

大数据相关书籍

大数据相关书籍 大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍大数据相关书籍

2017-12-21

Netty权威指南

《Netty权威指南》是异步非阻塞通信领域的经典之作,基于最新版本Netty 5.0编写,是国内首本深入介绍Netty原理和架构的技术书籍,也是作者多年实战经验的总结和浓缩。在理论方面,讲解了Netty的逻辑架构模型和核心类库的设计原理,而且对Netty在大数据、互联网、游戏行业的应用进行了深入分析;实战方面,从第一个Netty入门程序到私有协议栈的设计和开发,通过实际例程,由浅入深地对Netty的核心API和类库的功能和用法进行了细致讲解。, 《Netty权威指南》适合架构师、设计师、软件开发工程师、测试人员和其他对Java NIO框架、Java通信感兴趣的相关人士阅读,相信通过学习《Netty权威指南》,能够熟悉和掌握Netty这一优秀的异步通信框架,实现高可用分布式系统的构建。

2017-12-08

bookmarks_2017_12_7.html

bookmarks_2017_12_7.html,记录工作学习各方面内容,持续更新中

2017-12-07

Unix时间戳和时间之间的转换工具

Unix时间戳和时间之间的转换工具 将2017-08-09转换成时间戳,以及将Unix时间戳转换成20170-08-09的格式化时间

2017-10-20

shell 复制脚本

shell 复制文件到指定文件夹的脚本,可以自动化执行。

2017-10-20

fastdfs-5.1.1安装设置快捷连接到的脚本

fastdfs-5.1.1安装设置快捷连接到的脚本 , fastdfs-5.1.1 链接 脚本

2017-10-20

删除redis中所有的特殊键值

shell脚本写的删除redis中所有特殊键值的脚本。也可以修改一下自动操作redis

2017-10-20

fastdfs-5.11

开机启动,打开/etc/rc.d/rc.local并将如下配置追加到文件中: service fdfs_storage start

2017-10-10

redispipeLine

redis pipleLine

2017-08-22

bookmarks_2017_5_26.html

收藏经典

2017-05-26

hadoop生态

大数据实施部署

2017-05-25

KAFKA小示例

KAFKADemo 示例

2017-04-27

java RSA加密解密

java RSA加密解密

2017-04-10

hadoop-eclipse-plugin-2.6.0.jar

hadoop-eclipse-plugin-2.6.0.jar插件

2015-05-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除