一天两晒网
码龄8年
关注
提问 私信
  • 博客:81,868
    81,868
    总访问量
  • 22
    原创
  • 1,668,484
    排名
  • 20
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2017-02-22
博客简介:

希夷的博客

查看详细资料
个人成就
  • 获得23次点赞
  • 内容获得32次评论
  • 获得117次收藏
  • 代码片获得321次分享
创作历程
  • 2篇
    2023年
  • 3篇
    2022年
  • 1篇
    2021年
  • 3篇
    2019年
  • 3篇
    2018年
  • 10篇
    2017年
成就勋章
TA的专栏
  • OCR
  • doris
    3篇
  • ml
    1篇
  • hadoop
    3篇
  • scala
    1篇
  • 集群搭建
    4篇
  • flume
    3篇
  • spark
    3篇
  • kafka
    3篇
  • python
    2篇
  • sql
    1篇
  • hbase
    1篇
  • metrics
    1篇
  • ambari
    1篇
兴趣领域 设置
  • Python
    flask
  • 大数据
    hadoophivespark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Flink CDC2.4 整库实时同步MySql 到Doris

mysql 到doris的数据、表结构实时同步
原创
发布博客 2023.06.29 ·
6540 阅读 ·
5 点赞 ·
10 评论 ·
17 收藏

linux sshd 病毒清理

开启flink web submit 引起sshd 病毒的清理
原创
发布博客 2023.06.27 ·
827 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

机器学习分词词库1866万个

发布资源 2023.04.18 ·
txt

Doris be、fe自动拉起 及问题

Doris be、fe使用supervisor 实现自动拉起,及错误处理
原创
发布博客 2022.08.17 ·
3000 阅读 ·
1 点赞 ·
1 评论 ·
5 收藏

doris 1.1 外部表 SSL connection error: Failed to set ciphers to use (2026)

SSL connection error: Failed to set ciphers to use
原创
发布博客 2022.08.11 ·
822 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

使用 Flink CDC 实现 MySQL 数据,表结构实时入 Apache Doris

实现mysql到doris的增量同步,新加入表全量同步,实时修改表结构
原创
发布博客 2022.07.12 ·
5102 阅读 ·
2 点赞 ·
6 评论 ·
24 收藏

基于MinHashLSH的用户相似度

基于 MinHashLSH 算法的用户特征相似度
原创
发布博客 2021.04.22 ·
818 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Ambari 集成azkaban 导致问题处理

集成教程,参考https://github.com/leoChaoGlut/ambari-azkaban-service集成之后启动一、没有问题,但是stop出现错误:错误没有截图1、查看AzkabanExecutorServer启动脚本azkaban-executor-start.sh在启动AzkabanExecutorServer的时候,会吧PID写入文件cur...
原创
发布博客 2019.05.21 ·
968 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

ambari Metrics Collector 无法收集信息

ambari 2.6.4新装集群,发现每个组件的Metrics 是没有内容的下图红框(已修复的):之前都是No data no av.....ambari-metrics-collector 依赖于hbase,收集的信息先保存在Hbase中,因为hbase没有安装,安装hbase后,还是不行,重启hbase以及ambari-metrics 还是不行,查看日志,发现错误信息...
原创
发布博客 2019.03.22 ·
3061 阅读 ·
0 点赞 ·
3 评论 ·
3 收藏

mysql 游标使用 case when if elseif问题小结

背景:函数,传入参数ID,知识点ID,初始程度,根据答题记录计算顺序计算改学生该知识点掌握程度,需要逐条计算,每条计算依赖上一条得出的值,问题,游标定义问题,case when 内set问题初始版本;CREATE DEFINER=`cjtlis`@`%` FUNCTION `degree`(`masters` float,`start_time` datetime,`end_ti...
原创
发布博客 2019.02.26 ·
1326 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python kafka 多线程消费者&手动提交

官方文档:https://kafka-python.readthedocs.io/en/master/apidoc/KafkaConsumer.htmlimport threadingimport osimport sysfrom kafka import KafkaConsumer, TopicPartition, OffsetAndMetadatafrom consumers.db...
原创
发布博客 2018.07.05 ·
16142 阅读 ·
6 点赞 ·
10 评论 ·
34 收藏

flume自定义 file sink 以本地时间,event数据为目录

参考:https://www.cnblogs.com/sunyaxue/p/6645753.html数据收集为file时,不能以本地时间和数据内容分类接入文件,参考别人的文章实现代码:package flume;import org.apache.avro.util.Utf8;import org.apache.flume.*;import org.apache.flume.c
原创
发布博客 2018.01.05 ·
2337 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

flume自定义拦截器处理event

收集的数据为json格式,需要解析成以|分隔的字符串参考:http://blog.csdn.net/zfszhangyuan/article/details/52449060pom: org.apache.flume flume-ng-core 1.7.0 代码:pa
原创
发布博客 2018.01.05 ·
5690 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

python爬取奇书网小说

1、python2.72、pycharm3、奇书网:https://www.qisuu.com/如上图,导航栏中的分类是包含奇书网的所有图书,打开其中一个分类如上图,打开奇幻玄幻分类,在这个网页中,每一本书对应的是一本书 如上图,点开书名,进入相应的图书页如上图,点开【TXT格式下载】会进入这个页面,这个页面也就是书本在奇书网的位置一开始我以为获取奇...
原创
发布博客 2017.11.28 ·
4034 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

spark-jdbc No suitable driver found错误处理

错误如图:代码:object Mysql extends App{ val sparkConf = new SparkConf()//.setAppName("RDDRelation").setMaster("local[1]") val sc=new SparkContext(sparkConf) val sqlContext = new SQL
原创
发布博客 2017.09.08 ·
8412 阅读 ·
1 点赞 ·
1 评论 ·
2 收藏

Unable to load native-hadoop library spark-cluster模式相关错误

WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableWARN DomainSocketFactory: The short-circuit local reads feature cannot be used because libhadoop cannot be loaded.
原创
发布博客 2017.09.08 ·
309 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

kafka : A broker is already registered on the path /brokers/ids/1006. This proba

java.lang.RuntimeException: A broker is already registered on the path /brokers/ids/1006. This probably indicates that you either have configured a brokerid that is already in use, or else you have shutdown this broker and restarted it faster than the zook
原创
发布博客 2017.09.06 ·
6189 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

It is probably not running zookeeper节点启动失败

解决方法:查看进程ps aux | grep zookeeper如图所示,zk进程有两个,kz2181端口被占用。杀掉这两个进程,重启解决该错误会导致:kafka broker的节点无故挂掉,消费者或者生产者获取不了元数据
原创
发布博客 2017.09.06 ·
520 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark streaming 整合kafka

1、crateDateStream和createDirectStream区别2.createDirectStream代码
原创
发布博客 2017.08.03 ·
383 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flume监听端口整合kafka以及相关错误

之前的http.conf:#savecontenttofileagent2.sources=httpSrcagent2.channels=channelagent2.sinks=sinkagent2.sources.httpSrc.type=httpagent2.sources.httpSrc.bind=172.16.90.61agent2.sources.ht
原创
发布博客 2017.07.24 ·
1961 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多