python数据科学导论 中南_Python数据科学导论

译者序

前言

关于本书

关于作者

关于封面插图

第1章 大数据世界中的数据科学

1.1 数据科学和大数据的好处和用途

1.2 数据种类

1.2.1 结构化数据

1.2.2 非结构化数据

1.2.3 自然语言数据

1.2.4 计算机数据

1.2.5 图类数据

1.2.6 音频、视频和图像数据

1.2.7 流数据

1.3 数据科学过程

1.3.1 设置研究目标

1.3.2 检索数据

1.3.3 数据准备

1.3.4 数据探索

1.3.5 数据建模

1.3.6 展示与自动化

1.4 大数据生态系统与数据科学

1.4.1 分布式文件系统

1.4.2 分布式编程框架

1.4.3 数据集成框架

1.4.4 机器学习框架

1.4.5 NoSQL数据库

1.4.6 调度工具

1.4.7 基准测试工具

1.4.8 系统部署

1.4.9 服务开发

1.4.10 安全

1.5 Hadoop工作示例介绍

1.6 本章小结

第2章 数据科学过程

2.1 数据科学过程概述

2.2 步骤1:定义研究目标并创立项目章程

2.2.1 了解研究的目标和背景

2.2.2 创立项目章程

2.3 步骤2:检索数据

2.3.1 从存储在公司内部的数据开始

2.3.2 不要害怕去购买数据

2.3.3 检查数据质量以预防问题发生

2.4 步骤3:数据的清洗、整合以及转换

2.4.1 数据清洗

2.4.2 尽可能早地修正错误

2.4.3 从不同的数据源整合数据

2.4.4 数据转换

2.5 步骤4:探索性数据分析

2.6 步骤5:构建模型

2.6.1 模型与变量的选择

2.6.2 模型执行

2.6.3 模型诊断与模型比较

2.7 步骤6:展示结果并在其上搭建应用程序

2.8 本章小结

第3章 机器学习

3.1 什么是机器学习,为什么需要关注它

3.1.1 机器学习在数据科学中的应用

3.1.2 机器学习在数据科学过程中的使用

3.1.3 Python工具在机器学习中的应用

3.2 建模过程

3.2.1 特征工程以及模型选取

3.2.2 模型的训练

3.2.3 模型的验证

3.2.4 预测新的观测值

3.3 机器学习的类型

3.3.1 有监督学习

3.3.2 无监督学习

3.4 半监督学习

3.5 本章小结

第4章 单机上处理大数据

4.1 大数据处理过程中遇到的难题

4.2 处理巨量数据的通用技术

4.2.1 选择合适的算法

4.2.2 选择合适的数据结构

4.2.3 选择合适的工具

4.3 处理大数据集的通用编程技巧

4.3.1 不必重复发明轮子

4.3.2 充分利用硬件

4.3.3 减少计算需求

4.4 案例研究1:预测恶意URL

4.4.1 步骤1:确立研究目标

4.4.2 步骤2:获取URL数据

4.4.3 步骤4:数据探索

4.4.4 步骤5:建模

4.5 案例研究2:在数据库中建立一个推荐系统

4.5.1 所需的工具及技术

4.5.2 步骤1:研究问题

4.5.3 步骤3:数据准备

4.5.4 步骤5:建模

4.5.5 步骤6:展示与自动化

4.6 本章小结

第5章 大数据世界的第一步

5.1 数据分布存储和框架处理

5.1.1 Hadoop:存储和处理大数据集的框架

5.1.2 Spark:取代MapReduce以获得更好的性能

5.2 案例研究:借贷的风险评估

5.2.1 步骤1:研究目标

5.2.2 步骤2:数据检索

5.2.3 步骤3:数据准备

5.2.4 步骤4(数据探索)和步骤6(报告形成)

5.3 本章小结

第6章 了解NoSQL

6.1 NoSQL简介

6.1.1 ACID:关系型数据库核心原则

6.1.2 CAP理论:多节点数据库的问题

6.1.3 NoSQL数据库的BASE原则

6.1.4 NoSQL数据库的种类

6.2 案例研究:这是什么疾病

6.2.1 步骤1:设置研究目标

6.2.2 步骤2和步骤3:数据检索与数据准备

6.2.3 步骤4:数据探索

6.2.4 再回到步骤3:为描述疾病概况做数据准备

6.2.5 再回到步骤4:为描述疾病概况做数据探索

6.2.6 步骤6:展示与自动化

6.3 本章小结

第7章 图数据库的兴起

7.1 互联数据及图数据库概述

7.2 图数据库Neo4j概述

7.3 数据互联案例:食谱推荐引擎

7.3.1 步骤1:设置研究目标

7.3.2 步骤2:数据检索

7.3.3 步骤3:数据准备

7.3.4 步骤4:数据探索

7.3.5 步骤5:数据建模

7.3.6 步骤6:数据展示

7.4 本章小结

第8章 文本挖掘和文本分析

8.1 现实世界中的文本挖掘

8.2 文本挖掘技术

8.2.1 词袋

8.2.2 词干提取和词形还原

8.2.3 决策树分类器

8.3 案例研究:Reddit帖子分类

8.3.1 自然语言工具包

8.3.2 数据科学过程综述及第1步:研究目标

8.3.3 第2步:数据检索

8.3.4 第3步:数据准备

8.3.5 步骤4:数据探索

8.3.6 再回到步骤3:数据准备的调整

8.3.7 步骤5:数据分析

8.3.8 步骤6:展示与自动化

8.4 本章小结

第9章 面向终端用户的数据可视化

9.1 数据可视化选项

9.2 Crossfilter——JavaScript MapReduce库

9.2.1 安装

9.2.2 利用Crossfilter筛选药品数据集

9.3 用dc.js创建一个交互式控制面板

9.4 控制面板开发工具

9.5 本章小结

附录A 搭建Elasticsearch

附录B 搭建Neo4j

附录C 安装MySQL服务器

附录D 在虚拟环境下搭建Anaconda

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值