转自:https://blog.csdn.net/chengqiuming/article/details/78601350
https://blog.csdn.net/qq_22194911/article/details/71279619
一 数据分析的含义和目标
1、统计分析方法
2、提取有用信息
3、研究、概括、总结
二 Python与数据分析
1、Python:Guido van Rossum 1989圣诞假期
2、特点:简洁 开发效率高 运算速度慢 胶水特性
3、数据分析:numpy,scipy,matplotlib,pandas,scikit-learn、keras
4、用于Python科学计算与可视化的扩展模块主要有NumPy、SciPy、SymPy、matplotlib、Traits、TraitsUI、Chaco、TVTK、Mayavi、VPython、OpenCV
三 Python数据分析大家族
- numpy:科学计算包,支持N维数组运算、处理大型矩阵、成熟的广播函数库、矢量运算、线性代数、傅里叶变换、随机数生成,并可与C++/Fortran语言无缝结合。树莓派Python v3默认安装就已包含了numpy。
- scipy:scipy依赖于numpy,提供了更多的数学工具,包括矩阵运算、线性方程组求解、积分、优化等等。
- matplotlib:依赖于numpy模块和tkinter模块,可以绘制多种形式的图形,包括线图、直方图、饼状图、散点图、误差线图等等,图形质量可满足出版要求,是计算结果可视化的重要工具。
- pandas:基础数据分析套件
- scikit-learn:强大的数据分析建模库
- keras:人工神经网络