BIG DATA【更新中】
大数据专栏
努力的SIR
你只管努力,其他的交给天意。
展开
-
Kafka会不会丢消息?怎么处理的?
Kafka存在丢消息的问题,消息丢失会发生在Broker,Producer和Consumer三种。 Properties props = new Properties(); props.put("bootstrap.servers", "localhost:9092"); props.put("group.id", "test"); // 自动提交开关 props.put("enable.auto.commit", "true"); // 自动提交的时间间隔,此处是1s原创 2021-05-24 10:26:21 · 129 阅读 · 0 评论 -
关于hadoop2.0中的jobtracker和tasktracker
原创 2021-05-05 10:21:12 · 235 阅读 · 0 评论 -
Kafka的broker-list,bootstrap-server以及zookeeper的关系
broker指的是kafka的服务端,可以是一个服务器也可以是一个集群。producer和consumer都相当于这个服务端的客户端。 broker-list用来指定集群中的一个或者多个服务器,一般我们再使用console producer的时候,这个参数是必备参数;另外一个必备的参数是topic,如下示例: [atguigu@hadoop102 kafka]$ bin/kafka-console-producer.sh --broker-list hadoop002:9092 --topic first原创 2021-05-05 09:41:56 · 1761 阅读 · 0 评论 -
关于Linux中的环境变量设置
方法1:针对所有用户有效,所以只能在开发过程中使用;存在危险 vi /etc/profile export HADOOP_HOME=/opt/module/hadoop-2.7.2 export PATH=$PATH:$HADOOP_HOME/bin 方法2:针对当前特定用户有效原创 2021-05-03 21:17:40 · 84 阅读 · 0 评论 -
LINUX命令自由
通过执行 echo $SHELL 命令可以查看到当前正在使用的 Shell 。还可以通过 cat /etc/shells查看当前系统安装的所有 Shell 种类。原创 2021-04-19 14:57:43 · 213 阅读 · 0 评论 -
Spark Yarn模式下出现com.hadoop.compression.lzo.lzoCodec not found
问题:因为之前hadoop集群上配了lzo,spark还没有配置 方法:在spark的spark-env.sh中配置lzo export SPARK_LIBRARY_PATH=$SPARK_LIBRARY_PATH:/opt/module/hadoop-2.7.2/lib/native export SPARK_CLASSPATH=$SPARK_CLASSPATH:/opt/module/hadoop-2.7.2/share/hadoop/common/hadoop-lzo-0.4.20.jar ..原创 2020-12-03 20:09:31 · 245 阅读 · 0 评论 -
关于Kafka中的零拷贝技术
原创 2020-08-01 20:25:09 · 150 阅读 · 0 评论