前言
随着互联网的飞速发展,人们在互联网上的行为产生了海量数据,对这些数据存储、处理与分析带动了大数据技术的发展。其中,数据挖掘和分析技术可以帮助人们对庞大的数据进行相关分析,找到有价值的信息和规律,使得人们对世界的认识更快、更便捷。在数据分析领域,Python语言简单易用,第三方库强大,并提供了完整的数据分析框架,因此深受数据分析人员的青睐,Python已经当仁不让地成为数据分析人员的一把利器。
因此,本书从Python数据分析的基础知识入手,结合大量的数据分析示例,系统地介绍数据分析和可视化绘图的方法,带领读者一步步掌握Python数据分析的相关知识,提高读者解决实际问题的能力。
本书特色
(1) 内容全面,讲解系统。
(2) 给出了数据分析环境的安装和配置步骤。
(3) 详细介绍了使用Python进行数据分析与可视化的方法。
(4) 提供了多个有较高应用价值的项目案例,有很强的实用性。
(5) 提供丰富的配套资源。
本书内容
第1章数据分析与可视化概述,主要介绍数据分析与可视化的基本内容,数据、数据分析和数据挖掘的关系,数据分析与可视化的常用工具,Python数据分析与可视化的主要库以及Jupyter Notebook的基本使用方法。
第2章Python编程基础,主要介绍Python语言的基本语法、内建数据结构、函数以及文件操作。
第3章NumPy数值计算基础,主要介绍数组及其索引、数组运算、数组读/写及常用的统计与分析方法。
第4章Pandas统计分析基础,主要介绍Pandas数据结构、索引操作、数据运算、分组汇总聚合、透视表以及Pandas的常用绘图。
第5章Pandas数据载入与预处理,主要针对数据预处理阶段的需求,介绍使用Pandas载入数据、合并数据、数据清洗、数据标准化及数据转换的典型方法。
第6章Matplotlib数据可视化基础,主要介绍Pyplot绘图的基本语法、常用参数,各类常用图形的绘制及词云的简单用法。
第7章Seaborn可视化,主要介绍Seaborn可视化中的风格与主题设置及常见绘图的基本用法。
第8章pyecharts可视化,主要介绍pyecharts的安装与导入、绘图主要过程以及柱状图、饼图、漏斗图、散点图、K线图、仪表盘、词云、地图及组合图表的绘制方法。
第9章时间序列数据分析,主要介绍时间序列数据分析的基本方法,包括Pandas中的日期型数据、日期的范围、频率及日期的操作。
第10章SciPy科学计算,主要介绍SciPy中的常数和特殊函数、线性代数运算、优化、稀疏矩阵处理及简单的图像处理等内容。
第11章统计与机器学习,主要介绍sklearn库的基本功能、典型分类、聚类算法以及主成分分析方法及应用。
第12章图像数据分析,主要介绍OpenCV的导入、图像的基本操作、SIFT和SURF特征点的提取及图像的降噪。
第13章综合案例,介绍两个综合案例,针对职业人群体检数据和股票数据,结合前面章节介绍的数据分析和数据可视化技术,实现数据分析与可视化。
本书配套资源
教学大纲、教学课件、电子教案、程序源码、教学进度表,扫描封底的课件二维码可以下载。
420分钟的视频讲解,扫描书中相应位置的二维码可以在线观看、学习。
本书由魏伟一、李晓红编写。由于编者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。
编者2019年10月
more >