《白话大数据与机器学习》读书笔记第1章~第4章读书笔记

第一章:大数据产业
1、大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,在作者看来大数据产业生产流程从数据的生命周期的传导和演变上可以分为几个部分:

数据收集、数据存储、数据建模、数据分析、数据变现。

2、大数据人才,大数据人才可以分为以下3个方向:
(1)偏重基建与架构的“大数据结构”方向
研究方向为:架构理论(高并发,高可用,并行计算,MapReduce,Spark等);数据流应用(Flume,Fluentd,Kafka,ZMQ等);存储应用(HDFS,Ceph等);软件应用(Hive、HBase、Cassandra、PrestoDB等);可视化应用(HightCharts、ECharts,D3,HTML5,CSS3等)
(2)偏重建模与分析的“大数据分析”方向
研究方向:数据库应用(RDBMS,NoSQL,MySQL,Hive,Cassandra等);数据加工(ETL,Python);数据统计(统计,概率);数据分析(数据建模、数据挖掘、机器学习、回归分析、聚类、分类、协同过滤)
(3)偏重应用现实的“大数据开放”方向
主要研究方向:数据开发(RDBMS,NoSQL,Hive)&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值