大数据基础与应用笔记 第一周 初识大数据
内容来自中国大学MOOC,北京理工大学,大数据基础与应用课程,侵删。
如有错误,烦请指出。
大数据基础与应用笔记 第一周 初识大数据
一、大数据分析流程
1. 数据获取
- 获取数据
2. 数据清洗
- 补充部分数据缺失的属性值
- 统一数据格式、编码和度量
- 检测和删除异常数据
- 研究表明数据准备大概占 80% 的工作量
3. 数据管理
- 对数据进行分类、编码、存储、索引和查询
- 经历了文件管理、数据库、数据仓库、大数据时代新型数据管理系统
- 向着低成本、高效率的存储查询技术方向发展
- 数据安全与隐私保护受到广泛关注
4. 数据分析
- 统计查询
- 从数据中挖掘特定的模式
- 预测分析
5. 数据呈现
- 建立从输入数据到符合认知规律的可视化表征
- 利用可视化图形呈现数据中隐藏的信息和规律
- 能够创建可交互的视图
- 具体包括高维数据可视化、网络和层次数据可视化、时空数据可视化、文本数据可视化等
二、智能医疗大数据
1. 大数据在健康医疗行业中应用价值
2. 健康医疗大数据平台
3. 健康医疗大数据应用
4. 健康大数据发展趋势及智能医疗
三、金融科技与大数据风控
典型案例:风控
典型案例:证券