一、 大数据与数据科学专业
二、 大数据与数据科学培养的主要人才
大数据与数据科学主要培养大数据应用分析师、大数据系统工程师、大数据算法研究员几大类,猫先生官网登录搜hahabet每个大类下又可以根据具体的岗位职责做一定的细分,大致可以分为如下这些:
1、 大数据应用分析师:产品、行业应用、解决方案、数据分析、创新
2、 大数据系统工程师:系统、架构、开发、维护、管理
3、 大数据算法研究员:算法实现/调优、新理论、新结构/新算法、方向/趋势
三、 大数据与数据科学的整体课程体系
数学/统计理论:微积分、线性代数、概率论、数理统计、统计学习
计算科学:计算机系统、编程语言、数据结构、信息系统架构(CS/BS等)
数据系统:分布式理论、Hadoop/Spark生态、数据库/数据仓库
模型分析:机器学习理论、优化建模、模式识别、知识表示/推理、可视化分析
行业应用:商务智能、智能金融、供应链分析、城市规划等
数据伦理:大数据管理与创新、大数据治理与政策
四、 大数据与数据科学的主要课程内容
1、概率论与数理统计
数理统计的基本概念、抽样分布、参数估计、假设检验
2、多元统计分析
多元正态分布;聚类分析;判别分析;主成分分析;因子分析;对应分析;Logistic回归模型、偏最小二乘回归模型等。
3、微积分
基本的微积分概念、计算原理
4、线性代数
基本的线性代数概念、计算原理
5、时间序列分析
时间序列的基本概念、基本原理、基本方法、定量分析
6、程序设计/数据结构
编程语言(Python或R、C或Java)、主要的程序结构、基本的数据结构、常用算法
7、计算机系统基础
计算机系统架构的基本概念、常规信息系统的基本架构、主要的数据传输方法、数据解析和信息抽取技术
8、大数据导论
Hadoop大数据的基本概念、大数据分析基础、大数据挖掘基础、大数据可视化技术基础、大数据存储技术基础、猫先生优选hahabet哈哈电竞hahabet大数据安全技术基础、数据科学基础、大数据与crm等
9、Hadoop大数据技术
Hadoop生态,介绍Hadoop的安装和配置,Hadoop的组件包括HDFS分布式存储系统,MapReduce计算框架,海量数据库HBase,Hive数据仓库,Pig、ZooKeeper管理系统等知识
10、分布式数据库原理及应用
介绍分布式数据库的原理和应用,以及当前大数据行业主要的非结构化的数据库,内容包括分布式数据库设计ÿ