一.课程简介和环境搭建
1.数据分析—进阶技能树
懂基本的涉及理论,会简单的数据分析
懂得用建模、可视化方法对数据进行探索和总结(股票K线图)
深入相关业务,利用数据分析直接创造价值(如投资策略,个性化推荐)
2.matplotlib简介
matplotlib是基于Python语言的开源项目,是python的一个数据绘图包,用户在熟悉了核心对象之后,可以轻易地定制对象。
函数式绘图和面向对象式绘图
函数式绘图,参考了matlab里面地绘图函数语法
面向对象式绘图,matplotlib的底层架构,有更多功能。
3.环境搭建
使用Anaconda作为核心解释器和相关的包。
Anaconda集成了数据分析,科学计算相关的几乎所有包。
比如:Numpy,Scipy,Matplotlib,Ipython
Pycharm作为IDE,也就是编辑器的功能。
community版本式免费的。
Python console用的是Ipython。
二.Numpy简介
1.Numpy是什么
Numpy是Python的开源的数值计算扩展
可用来存储和处理大型矩阵,比Python自身数据结构要高效
Numpy将Python变成一种免费的强大的Matlab系统
其实python本身有数据结构
比如说用嵌套的l矩阵就可以存储矩阵,但是numpy比python自身的数据结构更高效。也就是Numpy将Python变成一种免费的强大的Matlab系统。
2.ndarray
ndarray可以理解为一个矩阵,相当于存储了一些我们需要的数据。
2.1创建nadarray对象
从Python的基础数据对