weixin_43847900
码龄6年
关注
提问 私信
  • 博客:19,235
    社区:2
    19,237
    总访问量
  • 21
    原创
  • 426,631
    排名
  • 4
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2018-11-28
博客简介:

weixin_43847900的博客

查看详细资料
个人成就
  • 获得7次点赞
  • 内容获得12次评论
  • 获得33次收藏
创作历程
  • 22篇
    2021年
成就勋章
TA的专栏
  • 爬虫
    4篇
  • 大数据
    16篇
  • maxwell
    1篇
  • elasticsearch
    3篇
  • 源码
    1篇
  • 大数据错误
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

读取kafka的偏移量的工具类

读取kafka的偏移量的工具类// An highlighted blockimport java.util.Propertiesimport org.apache.kafka.clients.consumer.ConsumerRecordimport org.apache.kafka.common.TopicPartitionimport org.apache.kafka.common.serialization.StringDeserializerimport org.apache.sp
原创
发布博客 2021.10.11 ·
274 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Maxwell 的使用

Maxwell 的使用1.Maxwell介绍Maxwell介绍Maxwell是由美国zendesk开源,用java编写的Mysql实时抓取软件,其抓取的原理也是基于binlog。2.Maxwell 和canal工具对比➢Maxwell没有canal那种server+client模式,只有一个server把数据发送到消息队列或redis。如果需要多个实例,通过指定不同配置文件启动多个进程。➢Maxwell有一个亮点功能,就是canal只能抓取最新数据,对已存在的历史数据没有办法处理。而Maxwell
原创
发布博客 2021.10.11 ·
979 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

大数据组件启动顺序

原创
发布博客 2021.07.06 ·
271 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink 读取kafka数据

下面展示一些 内联代码片。package io.github.interestinglab.waterdrop.flink.testimport java.util.Propertiesimport org.apache.flink.api.common.serialization.SimpleStringSchemaimport org.apache.flink.streaming.api.scala._import org.apache.flink.streaming.connectors.
原创
发布博客 2021.06.08 ·
270 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink 将数据写入到kafka

下面展示一些 内联代码片。package io.github.flink.test/** * Flink 没有类似于 spark 中 foreach 方法,让用户进行迭代的操作。虽有对外的 * 输出操作都要利用 Sink 完成。最后通过类似如下方式完成整个任务最终输出操作。 * stream.addSink(new MySink(xxxx)) */import org.apache.flink.api.common.serialization.SimpleStringSchemai
原创
发布博客 2021.06.08 ·
703 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

多线程爬取携程网酒店数据,星级数据和经纬度

下面展示一些 内联代码片。多线程爬取携程网酒店星级数据和经纬度import threadingfrom queue import Queueimport configimport urllibimport reimport pandas as pdnum_of_threads=10def write_fun(line): with open('酒店0502.csv','a',encoding='utf-8') as f: f.write(line)
原创
发布博客 2021.06.08 ·
1119 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

flink source 写入mysql或者jdbc

// A code blockvar foo = 'bar';package io.github.flink.testimport java.util.Randomimport org.apache.flink.streaming.api.functions.sink.{RichSinkFunction, SinkFunction}import org.apache.flink.streaming.api.functions.source.SourceFunctionimport org.
原创
发布博客 2021.06.08 ·
282 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

flink 链接source 将数据写入Elasticsearch

maven 依赖 <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-elasticsearch6_2.11</artifactId> <version>1.9.2</version> </dependency>
原创
发布博客 2021.06.08 ·
295 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

flink KeyedProcessFunction 源码分析

KeyedProcessFunction 继承 AbstractRichFunction 函数Function为基础函数接口,为纯接口里面没有方法RichFunction 继承基础接口Function里面封装了到了运行环境函数,open和close 方法还有得到迭代运行时间内容public abstract class KeyedProcessFunction<K, I, O> extends AbstractRichFunction { private static fi.
原创
发布博客 2021.06.04 ·
259 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

flink BoundedOutOfOrdernessTimestampExtractor

BoundedOutOfOrdernessTimestampExtractor 实现了AssignerWithPeriodicWatermarks (注册周期生成Watermarks)源码如下第一次注册会生成当前最大时间戳currentMaxTimestamp =lastEmittedWatermark - 时间间隔(maxOutOfOrderness)public abstract class BoundedOutOfOrdernessTimestampExtractor<T>
原创
发布博客 2021.06.03 ·
1359 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Caused by: java.lang.NoSuchMethodError: org.elasticsearch.action.DocWriteRequest.parent()Ljava/lang/

// 创建index request,准备发送数据val indexRequest = Requests.indexRequest().index(“wtte”).type(“data”).source(json)flink 写入elasticsearch 报错 Caused by: java.lang.NoSuchMethodError: org.elasticsearch.action.DocWriteRequest.parent()Ljava/lang/解决 添加maven 依赖 &l
原创
发布博客 2021.06.02 ·
426 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ES常用命令

#查看集群健康Get /_cat/health/?vGet /_cat/health?v#查看节点情况GET /_cat/nodes/?v#查询各个索引状态GET /_cat/indices?v#创建一个索引PUT /movie_indexPUT /sensor#删除一个索引DELETE /movie_index#查看某一个索引的分片情况GET /_cat/shards/movie_index?vGET /_cat/shards/sensor?v#创建文.
原创
发布博客 2021.06.02 ·
282 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Caused by: redis.clients.jedis.exceptions.JedisDataException: NOAUTH Authentication required

flink 链接redis报错Caused by: redis.clients.jedis.exceptions.JedisDataException: NOAUTH Authentication required原因是没有权限(NOAUTH Authentication required),解决办法就是加上val conf = new FlinkJedisPoolConfig.Builder().setHost(“127.0.0.1”).setPort(6379).setPassword(’’
原创
发布博客 2021.06.02 ·
900 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Caused by: java.lang.ClassNotFoundException: org.apache.flink.api.common.typeinfo.TypeInformation 错误

Exception in thread “main” java.lang.NoClassDefFoundError: org/apache/flink/api/common/typeinfo/TypeInformationat io.github.interestinglab.waterdrop.flink.test.RedisSinkTest.main(RedisSinkTest.scala)Caused by: java.lang.ClassNotFoundException: org.apache
原创
发布博客 2021.06.02 ·
784 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink入门参数设置(二)

// An highlighted blockpublic class ConfigKeyName { public final static String TIME_CHARACTERISTIC = "execution.time-characteristic"; public final static String BUFFER_TIMEOUT_MILLIS = "execution.buffer.timeout"; public final static String PAR
原创
发布博客 2021.05.27 ·
354 阅读 ·
1 点赞 ·
3 评论 ·
0 收藏

Flink 入门和环境创建以及各种参数含义(一)

// An highlighted blockimport org.apache.flink.api.common.time.Time;import org.apache.flink.api.java.ExecutionEnvironment;import org.apache.flink.contrib.streaming.state.RocksDBStateBackend;import org.apache.flink.runtime.state.StateBackend;import o..
原创
发布博客 2021.05.27 ·
197 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

获取马蜂窝景点数据和景点评论数据

CREATE TABLE `poi` ( `poi_id` int NOT NULL, `name` varchar(128) DEFAULT NULL, `image` varchar(512) DEFAULT NULL, `link` varchar(512) DEFAULT NULL, `lat` float DEFAULT NULL, `lng` float DEFAULT NULL, `type` int DEFAULT NULL, `is_cnmain` int.
原创
发布博客 2021.05.25 ·
1361 阅读 ·
1 点赞 ·
2 评论 ·
12 收藏

获取搜狗指数数据

// An highlighted blockimport requests, re ,jsonfrom bs4 import BeautifulSoupimport randomimport jsonimport timeuser_agent_list = [ 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Saf
原创
发布博客 2021.05.25 ·
213 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

获取www.maigoo.com 景点爬虫,包括1A到5A级景点名称。景点地址,景点描述和景点经纬度

下面展示一些 内联代码片。// An highlighted blockimport requests, re ,jsonfrom bs4 import BeautifulSoupimport randomimport jsonimport timeuser_agent_list = [ 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.
原创
发布博客 2021.05.25 ·
991 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

Spark read.json 用法

// An highlighted block val otherPeopleDataset = ssc.createDataset( """{"name":"Yin","address":{"city":"Columbus","state":"Ohio"}}""" :: Nil) val otherPeople = ssc.read.json(otherPeopleDataset) otherPeople.show() val schema = ssc.re
原创
发布博客 2021.05.25 ·
1485 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多