【项目二】爱奇艺分类点击实时统计

最新推荐文章于 2021-05-26 21:37:10 发布

Jenrey

最新推荐文章于 2021-05-26 21:37:10 发布

阅读量1.8k

点赞数 4

分类专栏：项目文章标签： Spark项目实时统计

本文链接：https://blog.csdn.net/jenrey/article/details/80407377

版权

项目专栏收录该内容

6 篇文章 0 订阅

订阅专栏

项目源码：

SparkStreaming部分：https://gitee.com/jenrey/project_two

SpringBoot部分：https://gitee.com/jenrey/project_two_two

1.项目需求

2.项目过程

3.数据格式

ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time=1449137597979&p_url=http://list.iqiyi.com/www/4/---.html

4.项目开发

4.1 配置maven

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.aura.spark</groupId>
    <artifactId>1711categorycount</artifactId>
    <version>1.0-SNAPSHOT</version>

    <dependencies>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.6.5</version>
        </dependency>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.11</artifactId>
            <version>2.3.0</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-streaming-kafka-0-8_2.11 -->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming-kafka-0-8_2.11</artifactId>
            <version>2.3.0</version>

        </dependency>

        <!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-client -->
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>0.98.6-hadoop2</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-server -->
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-server</artifactId>
            <version>0.98.6-hadoop2</version>
        </dependency>


    </dependencies>


</project>

4.2 模拟生成样本数据

package com.jenrey.spark.utils;

import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Random;

/**
 * 模拟两万条数据并且保存到指定目录
 */
public class SimulateData {
    public static void main(String[] args) {
        BufferedWriter bw = null;
        try {
            bw = new BufferedWriter(new FileWriter("G:\\workspace\\categorycount\\src\\main\\java\\com\\jenrey\\spark\\data.txt"));
            int i = 0;

            while (i < 20000) {
                long time = System.currentTimeMillis();
                int categoryid = new Random().nextInt(23);
                bw.write("ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time=" + time + "&p_url=http://list.iqiyi.com/www/" + categoryid + "/---.html");
                bw.newLine();   //换行
                i++;
            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                bw.close();
            } catch (IOException e) {
                e.printStackTrace();
            } finally {
            }
        }
    }
}

运行代码即可，会生成模拟数据

4.3 使用SparkStreaming从kafka中读取数据

package com.jenrey.spark.category;

import kafka.serializer.StringDecoder;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.kafka.KafkaUtils;
import scala.Tuple2;

import java.util.HashMap;
import java.util.HashSet;

/**
 * SparkStreaming的数据来源来自于Kafka的topics的aura
 */
public class CategoryRealCount {
    public static void main(String[] args) {
        //初始化程序入口
        SparkConf conf = new SparkConf();
        conf.setMaster("local");
        conf.setAppName("CategoryRealCount");
        JavaSparkContext sc = new JavaSparkContext(conf);
        JavaStreamingContext ssc = new JavaStreamingContext(sc, Durations.seconds(3));
        /*或者使用下面方法就自动创建SparkContext()
        JavaStreamingContext ssc = new JavaStreamingContext(conf, Durations.seconds(3));*/

        //读取数据
        HashMap<String, String> KafkaParams = new HashMap<>();
        KafkaParams.put("metadata.broker.list", "hadoop04:9092");
        HashSet<String> topics = new HashSet<>();
        topics.add("aura");
        JavaDStream<String> logDStream = KafkaUtils.createDirectStream(
                ssc,
                String.class,
                String.class,
                StringDecoder.class,
                StringDecoder.class,
                KafkaParams,
                topics
        ).map(new Function<Tuple2<String, String>, String>() {
            @Override
            public String call(Tuple2<String, String> tuple2) throws Exception {
                //kafka读出来数据是kv的形式[String代表k的数据类型（k可就是偏移位置的信息, String代表v的数据类型（kafka内每一条数据）, StringDecoder代表的就是解码器, StringDecoder]
                //直接返回的是InputDStream[(String,String)]的KV数据类型，因为偏移位置的信息对我们是没有用的所以我们要.map(_._2)
                return tuple2._2;
            }
        });
        //代码的逻辑
        logDStream.print();
        //启动应用程序
        ssc.start();
        try {
            ssc.awaitTermination();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        ssc.stop();

    }
}

5.启动kafka的HA集群

先启动ZK

[hadoop@hadoop03 kafka_2.11-0.8.2.0]$ bin/kafka-server-start.sh config/server.properties

[hadoop@hadoop04 kafka_2.11-0.8.2.0]$ bin/kafka-server-start.sh config/server.properties

[hadoop@hadoop05 kafka_2.11-0.8.2.0]$ bin/kafka-server-start.sh config/server.properties

创建topics

[hadoop@hadoop04 kafka_2.11-0.8.2.0]$ bin/kafka-topics.sh --create --zookeeper hadoop02:2181 --replication-factor 3 --partitions 3 --topic aura

查看topics副本

[hadoop@hadoop03 kafka_2.11-0.8.2.0]$ bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic aura

删除topics(此方式不一定会删除彻底，理论上还要去tmp/kafka-log/下删除数据及分区，如果flume写入topics不成功建议换个topics试试)

[hadoop@hadoop03 kafka_2.11-0.8.2.0]$ bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic aura

那么此时的删除并不是真正的删除，而是把topic标记为：marked for deletion

进入zk

zkCli.sh

找到topic所在的目录：ls /brokers/topics

到要删除的topic，执行命令：rmr /brokers/topics/【topic name】即可，此时topic被彻底删除。

6.模拟数据实时产生

[hadoop@hadoop04 ~]$ cat data.txt | while read line
> do
> echo "$line" >> data.log
> sleep 0.5
> done

克隆会话，使用 tail -F data.log 命令查看实时产生的数据

7.编写并运行flume

[hadoop@hadoop04 ~]$ touch file2kafka.properties

[hadoop@hadoop04 ~]$ vim file2kafka.properties

a1.sources = r1
a1.sinks = k1
a1.channels = c1

#source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /home/hadoop/data.log

#channel
a1.channels.c1.type = memory

#sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = aura
a1.sinks.k1.brokerList = hadoop04:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 5

#source -> channel -> sink
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动flume：

[hadoop@hadoop04 ~]$ flume-ng agent --conf conf --conf-file file2kafka.properties --name a1 -Dflume.hadoop.logger=INFO,console

或者是下图的日志：

查看kafka消费者能否消费的到数据：

[hadoop@hadoop04 kafka_2.11-0.8.2.0]$ bin/kafka-console-consumer.sh --zookeeper hadoop02:2181 --topic aura --from-beginning

运行categorycount.java程序后的效果图：

出现上图即代表：flume采集日志存到kafka中，然后SparkStreaming从kafka消费数据成功

8.开发HBase相关部分

8.0 开发bean 抽象出来存入HBase数据对象

package com.jenrey.bean;

import java.io.Serializable;

/**
 * 使用面向对象的思想抽象出来的存入HBase中数据类型的类
 */
public class CategoryClickCount implements Serializable {
    //点击的品类
    private String name;
    //点击的次数
    private long value;

    public CategoryClickCount(String name, long value) {
        this.name = name;
        this.value = value;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public long getValue() {
        return value;
    }

    public void setValue(long value) {
        this.value = value;
    }
}

8.1 开发HBaseDao的代码

package com.jenrey.hbase.dao;

import com.jenrey.bean.CategoryClickCount;

import java.util.List;

/**
 * 访问HBase数据库的一些方法
 */
public interface HBaseDao {
    //往hbase里面插入一条数据
    public void save(String tableName, String rowkey, String family, String q, long value);

    //按照表名和rowkey查询数据
    public List<CategoryClickCount> count(String tableName, String rowkey);
}

8.2 HBase的API实现类

HBaseImpl.java的代码如下：

package com.jenrey.hbase.dao.impl;

import com.jenrey.bean.CategoryClickCount;
import com.jenrey.hbase.dao.HBaseDao;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.PrefixFilter;
import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

/**
 * HBaseAPI的实现类
 */
public class HBaseImpl implements HBaseDao {
    //获取数据库连接,类似于JDBC里面的连接池的概念
    HConnection htablePool = null;

    //只要一new就执行下面构造方法里面的代码，即创建并连接HBase成功
    public HBaseImpl() {
        //创建HBase的配置文件
        Configuration conf = HBaseConfiguration.create();
        //设置zookeeper
        conf.set("hbase.zookeeper.quorum", "hadoop02:2181");
        try {
            //创建连接
            htablePool = HConnectionManager.createConnection(conf);
        } catch (IOException e) {
            e.printStackTrace();
        }

    }

    /**
     * 根据表名获取表对象
     *
     * @param tableName 表名
     * @return 表对象
     * HTableInterface  得到这个表的名称（HBase自带API）
     */
    public HTableInterface getTable(String tableName) {
        HTableInterface table = null;
        try {
            //根据表名获取表对象
            table = htablePool.getTable(tableName);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return table;
    }

    //

    /**
     * 实现往hbase里面插入一条数据
     *
     * @param tableName 表名
     * @param rowkey    rowkey
     * @param family    列簇
     * @param q         品类
     * @param value     出现了多少次
     *                  hbase:只有一种数据类型，字节数组
     */
    @Override
    public void save(String tableName, String rowkey, String family, String q, long value) {
        HTableInterface table = getTable(tableName);
        try {
            //incrementColumnValue会自动帮我们累加value的值。不需要在读取、累加、返回值
            table.incrementColumnValue(rowkey.getBytes(), family.getBytes(), q.getBytes(), value);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (table != null) {
                try {
                    table.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
    }

    //

    /**
     * 实现按照表名和rowkey查询数据
     *
     * @param tableName 表名
     * @param rowkey    rowkey
     * @return
     */
    @Override
    public List<CategoryClickCount> count(String tableName, String rowkey) {
        //我们要的是电影和电视剧出现的次数，所以要封装成一个对象存到List集合中
        ArrayList<CategoryClickCount> list = new ArrayList<>();
        //获取表对象
        HTableInterface table = getTable(tableName);
        //前缀过滤器
        PrefixFilter prefixFilter = new PrefixFilter(rowkey.getBytes());
        //创建扫描仪
        Scan scan = new Scan();
        //给扫描仪安装过滤器
        scan.setFilter(prefixFilter);
        //拿着扫描仪去获取数据
        try {
            ResultScanner scanner = table.getScanner(scan);
            //遍历集合，一个结果就是一个Result对象
            for (Result result : scanner) {
                //我们要的是电影和电视剧出现的次数，所以要封装成一个对象存到List集合中,既是CategoryClickCount对象，name value
                //rowkey date_name

                //遍历里面的每一个东西，rawCells把里面的每一个东西都看成一个单元格
                for(Cell cell:result.rawCells()){
                    byte[] date_name = CellUtil.cloneRow(cell);
                    String name = new String(date_name).split("_")[1];
                    byte[] value = CellUtil.cloneValue(cell);
                    long count = Bytes.toLong(value);
                    CategoryClickCount categoryClickCount = new CategoryClickCount(name, count);
                    list.add(categoryClickCount);
                }

            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (table != null) {
                try {
                    table.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }

        }
        return list;
    }
}

启动hbase集群：

（先启动zk，在启动hdfs）

启动 HBase 集群启动命令(只在hadoop02启动就可以了，在哪个节点启动哪个节点就是active)：start-hbase.sh

查看是否启动成功：

通过访问浏览器页面，格式为”主节点：16010”http://hadoop02:16010/

进入hbase的客户端：

hbase shell

执行下面的命令创建表：

create 'aura','f'

8.3 测试HBaseAPI代码

先创建一个HbaseFactory.java文件，代码如下：

package com.jenrey.hbase.dao.factory;

import com.jenrey.hbase.dao.HBaseDao;
import com.jenrey.hbase.dao.impl.HBaseImpl;

/**
 * 返回一个HBaseDao对象，HBaseDao是一个接口，HBaseImpl是它的实现类
 */
public class HBaseFactory {
    public static HBaseDao getHBaseDao() {
        return new HBaseImpl();
    }
}

再创建一个测试类：

Test.java的代码如下：

package com.jenrey.test;

import com.jenrey.bean.CategoryClickCount;
import com.jenrey.hbase.dao.HBaseDao;
import com.jenrey.hbase.dao.factory.HBaseFactory;

import java.util.List;

/**
 * 测试HBaseImpl代码 (其实也就是测试HBase的API)
 */
public class Test {
    public static void main(String[] args) {
        //TODO:向HBase中插入数据
        //获取到HBaseImpl对象
        HBaseDao hBaseDao = HBaseFactory.getHBaseDao();
        //调用HBaseImpl的实现类的save方法往hbase里面插入一条数据的方法
        hBaseDao.save("aura","2018-5-23_电影","f","name",10L);
        hBaseDao.save("aura","2018-5-23_电影","f","name",20L);
        List<CategoryClickCount> list = hBaseDao.count("aura", "2018-5-23_电影");
        for(CategoryClickCount cc:list){
            System.out.println(cc.getName()+"   "+cc.getCount());
        }

    }
}

运行测试代码，结果如下即为HBaseAPI成功

再次测试一下代码：

package com.jenrey.test;

import com.jenrey.bean.CategoryClickCount;
import com.jenrey.hbase.dao.HBaseDao;
import com.jenrey.hbase.dao.factory.HBaseFactory;

import java.util.List;

/**
 * 测试HBaseImpl代码 (其实也就是测试HBase的API)
 */
public class Test {
    public static void main(String[] args) {
        //TODO:向HBase中插入数据
        //获取到HBaseImpl对象
        HBaseDao hBaseDao = HBaseFactory.getHBaseDao();
        //调用HBaseImpl的实现类的save方法往hbase里面插入一条数据的方法
        /*hBaseDao.save("aura","2018-5-23_电影","f","name",10L);
        hBaseDao.save("aura","2018-5-23_电影","f","name",20L);*/

       /* List<CategoryClickCount> list = hBaseDao.count("aura", "2018-5-23_电影");
        for(CategoryClickCount cc:list){
            System.out.println(cc.getName()+"   "+cc.getCount());
        }*/

        hBaseDao.save("aura", "2018-5-21_电视剧", "f", "name", 11L);
        hBaseDao.save("aura", "2018-5-21_电视剧", "f", "name", 24L);

        hBaseDao.save("aura", "2018-5-23_电视剧", "f", "name", 110L);
        hBaseDao.save("aura", "2018-5-23_电视剧", "f", "name", 210L);
        List<CategoryClickCount> list = hBaseDao.count("aura", "2018-5-2");
        for (CategoryClickCount cc : list) {
            System.out.println(cc.getName() + "   " + cc.getCount());
        }

    }
}

效果如下：

8.4 完善SparkStreaming代码的开发逻辑

先编写工具类：Utils.java 代码如下

package com.jenrey.utils;

import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.HashMap;

/**
 * 工具类：传入一行数据，返回我们要的数据格式：日期_品类 的字符串
 */
public class Utils {
    //传入一行内容，返回一个Key
    public static String getKey(String line) {
        HashMap<String, String> map = new HashMap<String, String>();
        map.put("0", "其他");
        map.put("1", "电视剧");
        map.put("2", "电影");
        map.put("3", "综艺");
        map.put("4", "动漫");
        map.put("5", "纪录片");
        map.put("6", "游戏");
        map.put("7", "资讯");
        map.put("8", "娱乐");
        map.put("9", "财经");
        map.put("10", "网络电影");
        map.put("11", "片花");
        map.put("12", "音乐");
        map.put("13", "军事");
        map.put("14", "教育");
        map.put("15", "体育");
        map.put("16", "儿童");
        map.put("17", "旅游");
        map.put("18", "时尚");
        map.put("19", "生活");
        map.put("20", "汽车");
        map.put("21", "搞笑");
        map.put("22", "广告");
        map.put("23", "原创");

        //TODO:切分数据，返回品类ID
        String categoryid = line.split("&")[9].split("/")[4];
        //获取到品类的名称
        String name = map.get(categoryid);
        //TODO:切分数据，返回日期
        String stringTime = line.split("&")[8].split("=")[1];
        //获取日期
        String date = getDay(Long.valueOf(stringTime));
        //返回我们要的日期_品类的对象
        return date+"_"+name;

    }

    //格式化日期为我们能看懂的格式
    public static String getDay(long time) {
        SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MMM-dd");
        return simpleDateFormat.format(new Date(time));
    }
}

完善之前4.3 的代码CategoryRealCount.java 完善代码逻辑（不再是输出到控制台，而是写入HBase中），先不要运行。先运行Test.java查询一下是否有22号这天的数据，结果再下文有介绍

package com.jenrey.spark.category;

import com.jenrey.hbase.dao.HBaseDao;
import com.jenrey.hbase.dao.factory.HBaseFactory;
import com.jenrey.utils.Utils;
import kafka.serializer.StringDecoder;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.kafka.KafkaUtils;
import scala.Tuple2;

import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;

/**
 * SparkStreaming的数据来源来自于Kafka的topics的aura
 */
public class CategoryRealCount {
    public static void main(String[] args) {
        /**
         * 初始化程序入口
         */
        SparkConf conf = new SparkConf();
        conf.setMaster("local");
        conf.setAppName("CategoryRealCount");
        /*JavaSparkContext sc = new JavaSparkContext(conf);
        JavaStreamingContext ssc = new JavaStreamingContext(sc, Durations.seconds(3));*/
        //或者使用下面方法就自动创建SparkContext()
        JavaStreamingContext ssc = new JavaStreamingContext(conf, Durations.seconds(3));
        ssc.checkpoint("/home/hadoop/checkpoint");
        /**
         * 读取数据
         */
        HashMap<String, String> KafkaParams = new HashMap<>();
        KafkaParams.put("metadata.broker.list", "hadoop04:9092");
        HashSet<String> topics = new HashSet<>();
        topics.add("test");
        //  createDirectStream使用直连的方式读取kafka中的数据
        KafkaUtils.createDirectStream(
                ssc,
                String.class,   //返回的key类型
                String.class,   //返回的value类型
                StringDecoder.class,    //解码器
                StringDecoder.class,    //解码器
                KafkaParams,
                topics
        ).map(new Function<Tuple2<String, String>, String>() {
            @Override
            public String call(Tuple2<String, String> tuple2) throws Exception {
                //kafka读出来数据是kv的形式[String代表k的数据类型（k可就是偏移位置的信息, String代表v的数据类型（kafka内每一条数据）, StringDecoder代表的就是解码器, StringDecoder]
                //直接返回的是InputDStream[(String,String)]的KV数据类型，因为偏移位置的信息对我们是没有用的所以我们要.map(_._2)
                return tuple2._2;
            }
        })
                /**
                 * 代码的逻辑
                 */
                //logDStream.print();
                .mapToPair(new PairFunction<String, String, Long>() {
                    public Tuple2<String, Long> call(String line) throws Exception {
                        return new Tuple2<String, Long>(Utils.getKey(line), 1L);
                    }
                }).reduceByKey(new Function2<Long, Long, Long>() {
            @Override
            public Long call(Long x, Long y) throws Exception {
                return x + y;
            }
        })
                //TODO:插入到HBase数据库
                .foreachRDD(new VoidFunction<JavaPairRDD<String, Long>>() {
                    @Override
                    public void call(JavaPairRDD<String, Long> rdd) throws Exception {
                        rdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String, Long>>>() {
                            @Override
                            public void call(Iterator<Tuple2<String, Long>> partition) throws Exception {
                                //获取连接HBase的连接对象
                                HBaseDao hBaseDao = HBaseFactory.getHBaseDao();
                                while (partition.hasNext()) {
                                    Tuple2<String, Long> tuple = partition.next();
                                    hBaseDao.save("aura", tuple._1, "f", "name", tuple._2);
                                    System.out.println(tuple._1 + "   " + tuple._2);
                                }
                            }
                        });
                    }
                });
        /**
         * 启动应用程序
         */

        ssc.start();
        try {
            ssc.awaitTermination();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        ssc.stop();

    }
}

修改Test.java中的代码如下：（目的在于从HBase中查询上面的代码是否写入到HBase中）

下图是未运行写入HBase数据的代码（CategoryRealCount.java ）截图：

运行CategoryRealCount.java 代码；

下图是运行CategoryRealCount.java 后的截图

下图是运行CategoryRealCount.java的结果截图：

需要注意的是图中为中文字，所以使用Test.java查询的时候要注意传入的日期

9 Springboot项目

9.1 创建SpringBoot

如果成功就一直下一步，如果失败请参照下图

进入https://start.spring.io

然后下载压缩包在解压。在通过IDEA导入项目

9.2 开发SpringBoot项目

9.2.1 新建templates 目录

如果我们要写前后台的项目的话，除了导入包还固定要有一个目录 templates 名字不能瞎起，必须叫这个名

9.2.2 配置pom.xml 文件

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
	<modelVersion>4.0.0</modelVersion>

	<groupId>com.jenrey</groupId>
	<artifactId>spring_boot</artifactId>
	<version>0.0.1-SNAPSHOT</version>
	<packaging>jar</packaging>

	<name>spring_boot</name>
	<description>Demo project for Spring Boot</description>

	<parent>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-parent</artifactId>
		<version>2.0.2.RELEASE</version>
		<relativePath/> <!-- lookup parent from repository -->
	</parent>

	<properties>
		<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
		<project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
		<java.version>1.8</java.version>
	</properties>

	<dependencies>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-web</artifactId>
		</dependency>

		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-test</artifactId>
			<scope>test</scope>
		</dependency>


		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-thymeleaf</artifactId>
		</dependency>



		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-client</artifactId>
			<version>2.6.5</version>
		</dependency>



		<!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-client -->
		<dependency>
			<groupId>org.apache.hbase</groupId>
			<artifactId>hbase-client</artifactId>
			<version>0.98.6-hadoop2</version>
		</dependency>


		<!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-server -->
		<dependency>
			<groupId>org.apache.hbase</groupId>
			<artifactId>hbase-server</artifactId>
			<version>0.98.6-hadoop2</version>
		</dependency>

	</dependencies>

	<build>
		<plugins>
			<plugin>
				<groupId>org.springframework.boot</groupId>
				<artifactId>spring-boot-maven-plugin</artifactId>
			</plugin>
		</plugins>
	</build>


</project>

注意我们要有下面这个包

按照上面的配置文件配置即可

9.2.3 SpringBoot快速入门之Hello代码

新建一个Hello.java

代码如下：

package com.jenrey.spring_boot;

import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.ResponseBody;

@Controller
public class Hello {
    @RequestMapping(value = "/test1")
    @ResponseBody
    public String test1(){
        return "1711";
    }
}

运行代码

点击右上角的运行按钮

出现下图所示即为发布好了。不需要Tomcat之类的。

打开浏览器输出下面的网址：

http://localhost:8080/test1

9.2.4 快速入门之页面跳转

修改Hello.java代码如下

package com.jenrey.spring_boot;

import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.ResponseBody;

@Controller
public class Hello {
    @RequestMapping(value = "/test1")
    @ResponseBody
    public String test1(){
        return "1711";
    }
    /**
     * 其实下面名字可以不一样，但是我们一般是一样的
     * 注意我们没有写@ResponseBody ，所以我们要在templates目录下新建一个和index1一样名字的HTML文件
     * 这样我们输入网址http://localhost:8080/test2
     * 就会自动跳转到index1页面（因为名字一样，index1.html）
     */
    @RequestMapping(value = "/test2")
    public String test2(){
        return "index1";
    }
}

在templates 目录下新建一个HTML的页面

代码如下：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>测试</title>
</head>
<body>
    <h1>今天天气不错</h1>
</body>
</html>

9.2.5 ECharts 使用

下载链接：http://echarts.baidu.com/download.html

引入ECharts及JQ：

注意需要先在resources目录下创建一个新的目录 static 目录

之后可以创建个js文件夹，因为后面可能还有css等

修改index1.html的代码如下

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>测试</title>
</head>
<script src="js/echarts.min.js"></script>
<body>
    <div id="main" style="width: 600px;height: 400px;"></div>
    <script type="text/javascript">
        // 基于准备好的dom，初始化echarts实例
        var myChart = echarts.init(document.getElementById('main'));

        // 指定图表的配置项和数据
        var option = {
            title: {
                text: 'ECharts 入门示例'
            },
            tooltip: {},
            legend: {
                data:['销量']
            },
            xAxis: {
                data: ["衬衫","羊毛衫","雪纺衫","裤子","高跟鞋","袜子"]
            },
            yAxis: {},
            series: [{
                name: '销量',
                type: 'bar',
                data: [5, 20, 36, 10, 10, 20]
            }]
        };

        // 【05】使用刚指定的配置项和数据显示图表。
        myChart.setOption(option);
    </script>
</body>
</html>

访问：http://localhost:8080/test2

到此这个简单案例展示完成，我们在新建一个index2.html网页

在Hello.java中增加下面代码

@RequestMapping(value = "/test3")
    public String test3(){
        return "index2";
    }

在index2.html中写下面代码：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>实时统计品类点击</title>
</head>
<script src="js/echarts.min.js"></script>
<body>
<div id="main" style="width: 600px;height: 400px;"></div>
<script type="text/javascript">
    // 基于准备好的dom，初始化echarts实例
    var myChart = echarts.init(document.getElementById('main'));

    // 指定图表的配置项和数据
    option = {
        title : {
            text: '某站点用户访问来源',
            subtext: '纯属虚构',
            x:'center'
        },
        tooltip : {
            trigger: 'item',
            formatter: "{a} <br/>{b} : {c} ({d}%)"
        },
        legend: {
            orient: 'vertical',
            left: 'left',
            data: ['直接访问','邮件营销','联盟广告','视频广告','搜索引擎']
        },
        series : [
            {
                name: '访问来源',
                type: 'pie',
                radius : '55%',
                center: ['50%', '60%'],
                data:[
                    {value:335, name:'直接访问'},
                    {value:310, name:'邮件营销'},
                    {value:234, name:'联盟广告'},
                    {value:135, name:'视频广告'},
                    {value:1548, name:'搜索引擎'}
                ],
                itemStyle: {
                    emphasis: {
                        shadowBlur: 10,
                        shadowOffsetX: 0,
                        shadowColor: 'rgba(0, 0, 0, 0.5)'
                    }
                }
            }
        ]
    };

    // 【05】使用刚指定的配置项和数据显示图表。
    myChart.setOption(option);
</script>
</body>
</html>

发布

http://localhost:8080/test3

把之前的项目导入到我们的SpringBoot中。复制bean和hbase两个目录下的所有文件就行了。

10. 自动刷新页面实时数据开发展示阶段

编写Hello.java 的代码如下：

package com.jenrey.spring_boot;

import com.jenrey.bean.CategoryClickCount;
import com.jenrey.hbase.dao.HBaseDao;
import com.jenrey.hbase.dao.factory.HBaseFactory;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.ResponseBody;

import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.List;

@Controller
public class Hello {
    @RequestMapping(value = "/test1")
    @ResponseBody
    public String test1(){
        return "1711";
    }
    /**
     * 其实下面名字可以不一样，但是我们一般是一样的
     * 注意我们没有写@ResponseBody ，所以我们要在templates目录下新建一个和index1一样名字的HTML文件
     * 这样我们输入网址http://localhost:8080/test2
     * 就会自动跳转到index1页面（因为名字一样，index1.html）
     */
    @RequestMapping(value = "/test2")
    public String test2(){
        return "index1";
    }

    @RequestMapping(value = "/test3")
    public String test3(){
        return "index2";
    }

    @RequestMapping(value = "/getList")
    @ResponseBody
    public List<CategoryClickCount> getList(){
        System.out.println("======过来了么？======");
        /*获取当前系统时间,需要注意我们用的是昨天的数据，但是真正开发应该用下面注释的代码进行逻辑
        long time = System.currentTimeMillis();
        SimpleDateFormat simpleDateFormat = new SimpleDateFormat();
        String today = simpleDateFormat.format(new Date(time));*/
        HBaseDao hBaseDao = HBaseFactory.getHBaseDao();
        //注意实际情况下面的日期不应该写死
        List<CategoryClickCount> list = hBaseDao.count("aura", "2018-五月-22");
        System.out.println(list.size());
        return list;
    }
}

修改index2.html 代码如下：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>实时统计品类点击</title>
</head>
<script src="js/echarts.min.js"></script>
<script src="js/jquery-3.1.1.min.js"></script>
<body>
<div id="main" style="width: 600px;height: 400px;"></div>
<script type="text/javascript">
    // 基于准备好的dom，初始化echarts实例
    var myChart = echarts.init(document.getElementById('main'));

    var datas;
    //ajax
    $.ajax({
        //想访问的URL
        url:"getList",
        //异步还是同步，我们是同步
        async:false,
        //数据类型（指定返回数据类型自动变成json格式）
        dataType:'json',
        //调用回调函数
        success:function (data) {
            datas=data
        }
    })


    // 指定图表的配置项和数据
    option = {
        title : {
            text: '品类点击实时情况',
            subtext: '纯属虚构',
            x:'center'
        },
        tooltip : {
            trigger: 'item',
            formatter: "{a} <br/>{b} : {c} ({d}%)"
        },
        legend: {
            orient: 'vertical',
            left: 'left',
        },
        series : [
            {
                name: '访问来源',
                type: 'pie',
                radius : '55%',
                center: ['50%', '60%'],
                data:datas,
                    //里面的原始数据的样式跟我们抽象出来的CategoryClickCount.java 是一样的。 {value:335, name:'直接访问'} 所以只要我们这里的数据是实时的就可以了

                itemStyle: {
                    emphasis: {
                        shadowBlur: 10,
                        shadowOffsetX: 0,
                        shadowColor: 'rgba(0, 0, 0, 0.5)'
                    }
                }
            }
        ]
    };

    // 【05】使用刚指定的配置项和数据显示图表。
    myChart.setOption(option);
</script>
<script>
    function myrefresh() {
        window.location.reload()
    }
    setTimeout('myrefresh()',2000) //每隔两秒调一次方法
</script>
</body>
</html>

运行SpringBoot项目，运行之前的SparkStreaming项目的CategoryCount.java 代码

http://localhost:8080/test3