利用Python进行数据分析学习记录
Python常用库简介
1.numpy为Python提供快速的数组处理能力。对于数值型数据,NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多;
2.pandas提供了快速便捷处理结构化数据的大量数据结构和函数;
3.matplotlib是最流行的用于绘制图表和其它二维数据可视化的Python库,生态非常好,可以作为默认的可视化工具;
4.IPython是Python数据栈最重要的工具之一,可以大大提高交互式计算和软件开发的生产率,它是Jupyter项目(一个交互和探索式计算的高效环境)中的一个组件,可以理解为一个用于编写、测试、调试Python代码的强化shell;
5.SciPy是提供了很多专门解决数学计算的各种标准集合,包括微积分,线代,信号处理等。
6.statsmodels是一个统计分析包,包含经典统计学和经济计量学的算法,包括线性回归,方差分析等;
7.scikit-learn是Python的通用机器学习工具包,包括分类,回归,聚类等。
8.注意当使用conda或pip安装包时,不能用pip升级conda的包,这样可能会导致环境发生问题;