离线分析的概念:离线分析指不在生产系统上直接做数据处理,把生产系统上的数据导入另外一个专门的数据分析环境(数据仓库中),跟生产系统脱离的情况下对数据进行计算跟处理,
离线数据分析:
处理的数据不是实时的,因为实时生产系统的数据导入到数据仓库中需要时间计算出结果也需要时间,所以hadoop处理的离线数据跟一手的实时数据之间会有时间差,hadoop不适合做oltp(联机事务处理)式应用,也不适合做实时数据分析处理,hdfs是半只读,只能插入追加数据不能修改数据,hadoop不是数据库,不支持事务的概念,hadoop不适合做实时在线交易系统,hadoop离线数据分析是它的特长