离线分析的概念:离线分析指不在生产系统上直接做数据处理,把生产系统上的数据导入另外一个专门的数据分析环境(数据仓库中),跟生产系统脱离的情况下对数据进行计算跟处理,离线数据分析
处理的数据不是实时的,因为实时生产系统的数据导入到数据仓库中需要时间,计算出结果也需要时间,所以hadoop处理的离线数据跟一手的实时数据之间会有时间差,hadoop不适合做oltp式应用,也不适合
做实时数据分析处理,hdfs是半只读,只能插入追加数据,不能修改数据,hadoop不是数据库,不支持事务的概念,hadoop不适合做实时在线交易系统,hadoop离线数据分析是它的特长
离线数据分析的概念性理解
最新推荐文章于 2022-09-13 21:33:02 发布