现实版的“疑犯追踪”是如何开展的?

童鞋们,
还记得在美剧《疑犯追踪》中,
Finch发明的人工智能“The Machine”吗?
它通过获得和关联大量数据,
可分析出即将发生的犯罪事件并发出预警。
可以说是灰常滴了不起了。
那么在现实中,
我们是怎么对犯罪数据进行分析的呢?

今天我们就来一起了解一下,如何通过 Apache Spark 和 Hive ETL 分析犯罪数据。

第一部分:了解有关提取、转换和加载 (ETL) 的信息

在这个教程中,您将学习对英国犯罪数据进行分析,从一开始直到获取最终结果,涵盖数据下载、数据转换,将数据加载至分布式数据仓库 Apache Hive,随后使用 Apache Spark 进行后续分析:

替代传统 ETL 工具的 Spark 和 Hive
从英国警方数据库中提取数据
数据清理
Apache Hive 和 ETL
运行 Hive SQL 脚本并显示结果

第二部分:探索分析方法

在这个教程中,您将了解如何集成不同来源的数据。您还将看到对犯罪率的规范化统计数据的计算,这有助于轻松比较不同地区的犯罪率:

将人口普查数据导入 Hive 中
犯罪数据和人口普查数据集概述
英国犯罪数据集
警察机构 IT 系统概述
人口普查和犯罪数据分析
R 直方图

点击“阅读原文” get 新技能,以更聪明的方式扼杀犯罪!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值