很多同学期待很久的数据分析教程,今天开始正式启动,不过说实话,个人觉得数据分析没有web和爬虫有意思,天天跟数据打交道,其实也很枯燥,不过学习数据分析对很多工作是很有帮助的,比如爬虫,爬下来的数据我们需要怎么处理,清洗,去重等等,这些属于很常见的工作需求,而这些需求,就和数据分析密不可分。
该系列教程,会着重讲工作实际应用中用的比较多的一些功能和知识点,以在最短时间,让大家最高效的掌握知识点
前期基础教程数主要给大家讲三个库:
numpy、pandas、matplotlib,简单理解来说,其中numpy主要操作数值型、pandas操作数值型和字符型,matplotlib用来绘图可视化
NUMPY(以下简称NP)是Python数据分析必不可少的第三方库,np的出现一定程度上解决了Python运算性能不佳的问题,同时提供了更加精确的数据类型。如今,np被Python其它科学计算包作为基础包,已成为Python 数据分析的基础,可以说,NP是SciPy、Pandas等数据处理或科学计算库最基本的函数功能库。因此,理解np的数据类型对python数据分析十分有帮助。
下面,本文将介绍Np的常用操作和基本数据类型。
1、安装和导入包
安装 : pip install numpy
导入包:import numpy as np (习惯都用as为numpy起别名np)
2、