-
技术使用
基于Hadoop3.1.3的数据处理
基于Hive3.0.1的etl数据清洗和数据库表创建(使用datagrip连接hive)
基于FineBI5.1的可视化报表
-
数据介绍
来源
国家地震科学数据中心——最新地震情况展示
网址:https://data.earthquake.cn/index.html
字段
序号:用于标识每一条地震记录的顺序,便于管理和查询。
发震时刻:地震发生的具体时间,通常以UTC或本地时间表示,精确到秒。这有助于我们了解地震发生的时间分布规律。
经度和纬度:地震震中的地理位置坐标,用于在地图上精确定位地震发生的位置。
震源深度:地震波源在地下的深度,以千米为单位。震源深度对地震的破坏力和影响范围有重要影响。
震级:表示地震释放能量大小的等级,常用的有里氏震级、矩震级等。震级是评估地震强度和破坏力的关键指标。
震中位置:地震震中所在的地理位置描述,通常结合经纬度信息和地名进行说明。
-
数据处理
1.建立数据库、创建数据表
1)建立数据库
--如果数据库已存在就删除
drop database if exists db_dizhen cascade ;
--创建数据库
create database db_dizhen ;
--切换数据库
use db_dizhen ;
2)创建数据表
--创建表,已存在就删除
drop table if exists db_dizhen.dz_datas;
create table db_dizhen.dz_datas(
dz_id string comment "序号",
dz_time string comment "发震时间",
dz_longitude string comment "经度",
dz_latitude string comment "维度",
dz_de