利用python进行数据分析之准备工作(1)

目录

 

一、简介

二、重要的python库

1.numpy库

2.pandas

3.matplotlib

4.IPython

5.Scipy

三、python环境安装和数据分析前的数据准备


一、简介

什么是数据?本栏目的数据主要指的是结构化的数据,通常我们使用数据这一说法来笼统地概括所有通用格式的数据,如:多维数组、表格型数据、关联数据、时间序列等。大部分数据集都会在我们实际的应用过程中被转化为更加适合我们分析和建模的结构化形式的数据。

为什么利用python进行数据分析?用python的主观原因是这门语言简单易学好上手,python已成为最受欢迎的动态编程语言之一。其拥有大量的Web框架,同时拥有一个巨大而且活跃的科学计算社区。在数据分析和交互、探索性计算和数据可视化方面pyhton支持我们可以只使用该语言去构建以数据为中心的应用程序。

同时python能够成功的集成C\C++\Fortran程序,大部分现代计算机环境都利用了Fortran\C库来实现线性代数、优选、积分、快速傅里叶变换等其他诸如此类的算法。python还支持构建生产系统,从而能更好的解决两种语言问题,例如python和java等构建出一套完整的系统。

python的劣势:python是一门解释型编程语言,因此python的程序在运行时几乎都会相对于编译型语言要慢的许多。在微信小程序开发首页我也做了说明,在时间比CPU值钱的快速发展时期,人们自然不愿意花费太多时间在代码编译运行时间上。对于高并发、多线程的应用程序而言,python拥有的一个叫做全局解释器锁的东西会防止解释器同时执行多条python字节码指令机制,因此python并不是一门十分理想的语言。

二、重要的python库

1.numpy库

Numpy(Numercial Python)是pyhton科学计算的基础包,本栏目大部分都是基于numpy以及构建其上的库,该库提供了以下功能:

  • 快速高效的多维数组对象ndarray;
  • 用于对数组执行元素级计算以及直接对数组执行数学运算的函数;
  • 用于读写硬盘上基于数组的数据集的工具;
  • 线性代数运算、傅里叶变换、以及随机数生成;
  • 用于将C\C++\Fortran代码集成到python的工具。

2.pandas

pandas提供了能使我们快速便捷的处理结构化数据的大量数据结构和函数,是python能成为强大而高效的数据分析的重要因素之一。本栏目用的最多的pandas对象是DataFrame,它是一个面向列的二维表结构,且含有行标和列标。

3.matplotlib

matplotlib是最流行的用于绘制数据图表的python库,它非常适合用于绘制出版物上的图表,它跟ipython结合的很好,因而提供了一种非常好用的交互式数据绘制环境,绘制的图表也是交互的。

4.IPython

IPython是python科学计算标准工具集的组成部分,增强python shell目的是提高编写、测试、调试pyhon代码的速度。它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。

5.Scipy

Scipy是一组专门解决科学计算中各标准问题域的包的集合。主要包括以下:

  • scipy.integrate:数值积分例程和微分方程求解器;
  • scipy.linalg:扩展了由numpy.linalg提供的线性代数历程和矩阵分解功能;
  • scipy.optimize:函数优化器以及根查找算法;
  • scipy.signal:信号处理工具;
  • scipy.sparse:稀疏矩阵和稀疏线性系统求解器;
  • scipy.special:specfun的包装器;
  • scipy.stats:标准连续和离散概率分布;
  • scipy.weave:利用内联的C++代码加速数组计算的工具。

三、python环境安装和数据分析前的数据准备

python的安装不做详解,网上有很多教程,建议以后都使用py3版本的环境,2020年以后将不再对python2做维护。

安装库时提供一个集成了python很多科学计算库的工具anaconda,下载对应的版本运行,就不用一个个装库那么麻烦了。当然若非windows系统而是linux系统那么就不必大费周章。本栏目使用的数据请自行下载:https://download.csdn.net/download/qq_25491201/10595335

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值