复杂脑力劳动者
码龄8年
关注
提问 私信
  • 博客:21,322
    动态:8
    21,330
    总访问量
  • 13
    原创
  • 879,102
    排名
  • 26
    粉丝
  • 0
    铁粉

个人简介:大数据开发、大数据运维 涉猎elk、hdfs、hive、yarn、flink、spark、kafka

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 目前就职: 上海擎创信息技术有限公司
  • 加入CSDN时间: 2017-03-16
博客简介:

JingWeiZ

博客描述:
狂浪是一种态度
查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得14次评论
  • 获得88次收藏
  • 代码片获得227次分享
创作历程
  • 1篇
    2021年
  • 4篇
    2020年
  • 8篇
    2019年
成就勋章
TA的专栏
  • 笔记
    1篇
  • python
    6篇
  • pyflink
    1篇
  • flink
    2篇
  • elasticsearch
    5篇
  • logstash
    1篇
兴趣领域 设置
  • 大数据
    sparketl
  • 运维
    运维开发
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

【运维大宝剑Bigsword】之elasticsearch集群分析

很多同学在生产环境使用最多的es集群管理组件就是开源的cerebro,包括我在内,工具箱内的使用率排得上top5,如果没有用过的同学可以自行在github搜索,本文重点也不是分享cerebro的使用。后边的内容我假设你对es的一些基本概念已经理解一些。不知道有没有人跟我一样,在使用cerebro的过程中,始终感觉这个神器缺少了点什么,比如索引的分布是否均衡、索引写入速度、读取的速度、哪些索引最hot、分片无法分配还要去call一下接口(好烦)、集群虽然是绿色,是否存在亚健康状态、当前集群的tps是多少
原创
发布博客 2021.02.20 ·
326 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

不会java但是想用flink,会python就够了 !PyFlink【二、深入学习pyflink源码】

一、PyFlink源码结构pyflink版本号:1.10.1安装方法:pip install apache-flink==1.10.1python版本要求:截止到2020年6月7号,官方要求至少为3.5,最高为3.7找到你当前环境中的pyflink包,一般在你的python目录中的site-package里边找到pyflink1.1、结构说明截图说明:pyflink下的目录结构如下─➤ tree.├── README.txt├── __init__.py├── __pyca
原创
发布博客 2020.06.08 ·
5029 阅读 ·
0 点赞 ·
5 评论 ·
29 收藏

不会java但是想用flink,会python就够了 !PyFlink【一、进入pyflink的世界】

不会java,只会python的开发不是个好运维
原创
发布博客 2020.06.07 ·
6194 阅读 ·
7 点赞 ·
6 评论 ·
45 收藏

【Flink1.9-配置篇】

本文大部分配置内容参考flink1.9版本官方英文说明,并加入个人配置说明,如果对翻译内容有疑问,可以联系我共同探讨。https://ci.apache.org/projects/flink/flink-docs-release-1.9/ops/config.html#blob-server
原创
发布博客 2020.05.12 ·
1358 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python抽取zabbix历史数据(1、调用zabbix的history.get接口2、直接取zabbix-mysql表,速度更快)

需求:轮训抽取指定hostid上单个监控项或者多个监控项的历史天数的所有数据效果:落地到本地文件中结果如下{"itemid": "28885", "clock": "1585756825", "value": "97.6439", "ns": "271291797"}{"itemid": "28885", "clock": "1585756885", "value": "97.6375", "ns": "354267511"}{"itemid": "28885", "clock": "15857.
原创
发布博客 2020.05.11 ·
1789 阅读 ·
3 点赞 ·
2 评论 ·
3 收藏

利用logstash提取kafka消息

需求背景从某一个kafka集群A中消费一条消息,并将该消息的中的字段分别发送给另外一个kafka集群B。举例某一条消息A的样式为{"a":58,"b":100.0,"c":7.58,"ip":"192.168.1.1"}想要拿到这消息的时候,将数据提炼为三条消息,如{"a":58,"ip":"192.168.1.1"}{"b":100.0,"ip":"192.168.1.1"}{...
原创
发布博客 2019.11.07 ·
1461 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

elasticsearch更新、删除api(带条件)

更新语句1、通过restful api工具a、app01_gtulog_eoi_20190101_20190101/log/_update_by_query 选择POSTb、批量设置ORDER_NUM为1{“script”: {“lang”: “painless”,“inline”: “ctx._source.ORDER_NUM=1”}}2、通过curl,常用curl -XP...
原创
发布博客 2019.11.04 ·
455 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python多条件抓去es数据并写入excel(大量数据)

环境:python3.7注意elasticsearch包要跟es环境版本号对应上from elasticsearch import Elasticsearch as esimport xlwtinstance = es(hosts='192.168.21.120')query = { "query": { "bool": { "mu...
原创
发布博客 2019.11.04 ·
782 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

es python接口批量更新命令

from elasticsearch import Elasticsearch as esinstance = es(hosts='192.168.21.120')query = { "script": { "lang": "painless", "inline": "if(ctx._source.AREA=='上海') {ctx._source.OR...
原创
发布博客 2019.11.04 ·
772 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

将路径下的压缩文件进行批量解压操作

import shutilimport osimport globclass Ball(object): def __init__(self, source_dir, target_dir): self.source_dir = source_dir self.target_dir = target_dir self.boot_dir...
原创
发布博客 2019.11.04 ·
241 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

简易轻量级http接口采集器

github下载地址:https://github.com/jingweiz300/http_metricfrom bottle import Bottle,run,route,template,post,requestimport jsonimport osimport logginglogging.basicConfig(filename='http_metric.log', ...
原创
发布博客 2019.11.04 ·
485 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

记录一次elasticsearch的写入优化(附带python客户端、golang客户端)

elasticsearch写入优化的探索
原创
发布博客 2019.11.04 ·
804 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

elasticsearch分词练习、自定义分词器练习

elasticsearch分词练习、自定义分词器练习分词练习自定义分词器分词练习准备数据post metric_zabbix/log{ "@message":"fjdlakjfdklafjda EventType=10 fdsfada", "@timestamp":"2019-02-22T17:45:49.000+08:00"}查看存进去的分词结果post met...
原创
发布博客 2019.09.24 ·
640 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏