SparkStreaming过滤黑名单数据简单案例

最新推荐文章于 2020-12-07 21:52:21 发布

luoyunfan6

最新推荐文章于 2020-12-07 21:52:21 发布

阅读量626

点赞数

分类专栏： spark基础文章标签： sparkstreaming 过滤

本文链接：https://blog.csdn.net/luoyunfan6/article/details/103108476

版权

根据自己制定的规则，判断出黑名单ip，保存起来。

在后续产生的数据中，与黑名单数据进行比对，进行筛选。

import org.apache.spark.SparkContext
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.SparkSession
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.{Seconds, StreamingContext}

object BlackListDemo {
  def main(args: Array[String]): Unit = {
    //SparkSession
    val spark: SparkSession = SparkSession.builder()
      .appName(BlackListDemo.getClass.getSimpleName)
      .master("local[*]")
      .getOrCreate()
    val sc: SparkContext = spark.sparkContext
    val ssc: StreamingContext = new StreamingContext(sc, Seconds(2))
    //核心步骤：
    //①指定黑名单，并封装到RDD中
    //这里只是一个简单的模拟黑名单数据，真实环境下是从别的地方读取的
    val blackListRDD: RDD[(String, String)] = sc.parallelize(Seq(("27.19.74.143", ""), ("110.52.250.126", "")))
    //Exception in thread "main" java.

最低0.47元/天解锁文章

luoyunfan6

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SparkStreaming过滤黑名单数据简单案例

根据自己制定的规则，判断出黑名单ip，保存起来。在后续产生的数据中，与黑名单数据进行比对，进行筛选。import org.apache.spark.SparkContextimport org.apache.spark.rdd.RDDimport org.apache.spark.sql.SparkSessionimport org.apache.spark.storage.Sto...
复制链接

扫一扫

专栏目录