1、课程介绍与环境搭建
数据分析-进阶技能树:
- 懂基本的统计理论,会简单的数据分析
- 懂得用建模、可视化的方法对数据进行探索和总结(股票k线图)
- 深入相关业务,利用数据分析直接创造价值(如投资策略,个性化推荐)
matplotlib:python语言开源项目,旨在为python提供一个数据绘图包。用户在熟悉核心对象之后,可以轻易的定制图像。
● 环境搭建
操作系统:Windows,linus,OS X三种系统上都可搭建环境
Anaconda:(核心)集成数据分析、科学计算相关的几乎所有常用安装包。如Numpy、Scipy、Matplotlib、Ipython等。
Pycharm:(编辑器)非常好用的python集成开发环境。
import matplotlib.pyplot as plt
plt.plot([1,2,3,4],[-4,-3,-2,-1])
plt.show()
2、Numpy简介
● 是什么:是python的开源的数值计算扩展;可用来存储和处理大型矩阵,比python自身数据结构更高效;numpy将python变成一种免费的强大的matlab系统。
● ndarray
● 创建:一般有三种创建方式
从python的基础数据对象转化
通过Numpy内生的函数生成
从硬盘(文件)读取数据
-- 从python的基础数据对象转化
import numpy as np
a=[1,2,3,4]
a
xl=np.array(a)
xl
type(xl)
-- 通