PART1 - “数据分析”课程内容导学
一、学习目的
- 掌握表示、清洗、统计和展示数据的能力
二、学习过程:
1. 表示数据:介绍第三方数据表示库NumPy
- 介绍ndarray的类型
- 存储数据的基本方法
- 相关数据函数
2. 绘制数据图形的方法:介绍第三方库Matplotlib
3. 介绍数据分析中最有效的第三方库Pandas
- 讲解series和DateFrame数据类型
- 针对上述两种类型的操作方法(二维、一维和带有时间的序列的使用方式)
4. 讲解教学案例
三、主题思想
1. 一个数据表达一个含义,一组数据则能表达一个或多个含义
2. 在表达一组数据时,通常需要摘要(有损地提取数据特征的过程)
3. 经过摘要,一组数据可能形成的有:
- 基本统计(含排序)
- 分布/累计统计
- 数据特征(相关性、周期性等)
- 数据挖掘(形成知识)
四、编程工具
1. 使用Anaconda IDE集成开发工具
2. 需要理解和掌握如下工具的使用:
- conda
- Spyder
- IPython
五、内容组织
1. 图形绘制
- 坐标系的绘制
- 饼图的绘制
- 直方图的绘制
- 极坐标图的绘制
- 散点图的绘制
2. 实例
- 实例1:图像的手绘效果
- 实例2:引力波的绘制
- 实例3:房价趋势的关联因素分析
- 实例4:股票数据的趋势分析曲线
PART2 - 常用的Python IDE工具
一、文本工具类IDE
1. IDLE
- 自带、默认、常用、入门级编写工具
- 包含交互式和文件式
- 适用情况
- Python入门
- 功能简单直接
- 300+代码以内
2. Notepad++
3. Sublime Text
- 专为程序员开发的第三方专用编程工具
- 专业编程体验
- 多种编程风格
- 工具非注册免费使用
4. Vim&Emacs
5. Atom
6. Komodo Edit
二、集成工具类IDE
1. PyCharm
- 社区版免费,专业版收费
- 简单,集成度高
- 适合较复杂工程
2. Wing
- 公司维护,工具收费
- 调试功能丰富
- 版本控制,版本同步
- 适合多人共同开发
3. PyDev&Eclipse
- 开源IDE开发工具
- 需要有一定开发经验
4. Visual Studio&PTVS
- 微软公司维护
- Windows环境为主
- 调试功能丰富
5. Anaconda&Spyder
- 开源免费
- 支持近800个第三方库
- 包含多个主流工具
- 适合数据计算领域开发
- Win/Linux/OS X
6. Canopy
- 公司维护,工具收费
- 支持近500个第三方库
- 适合科学计算领域应用开发
PART3 - Anaconda IDE的基本使用方法
一、下载及程序启动
- Anaconda下载地址
- 正常下载安装,需要Python环境
- 下载完成后,通过“Anaconda Navigator”进行程序的启动
二、支撑Anaconda的重要工具
Anaconda来源于包管理和环境管理工具conda
- conda是一个工具,用于包管理和环境管理
- 包管理与pip类似,可以管理Python第三方库(安装、卸载和更新)
- 环境管理能够允许用户使用不同版本Python,并能灵活切换
- conda将工具、第三方库、Python版本及conda自身都当作包,同等对待
- conda的相关命令
- conda --version,获取conda版本
- conda update conda,升级conda
三、Anaconda
- 一个集合,包括conda、某版本Python及一批第三方库等
- Anaconda是一个集成各类Python工具的集成平台,本身并不是一个开发环境
- Anaconda是一个第三方的编程框架,包含了一个强大的Python编辑器Spyder和Python交互式调试环境IPython
四、编程工具:Spyder
- 左侧:编辑区,用户可以在其中编写Python代码
- 右上:文件导航和帮助,查看相关路径的文件信息
- 右下:IPython区域,对运行的结果(输入)作相关响应的区域
五、交互式编程环境:IPython
-
IPython是一个功能强大的交互式shell。可以理解为是一个前台的显示脚本,核心的执行功能在后天的Python功能
-
适合进行交互式数据可视化和GUI相关应用
-
IPython的?
- 启动IPython后,可以输入一些参数和命令
- 可以在某些变量(函数)的前面或后面输入?来获得变量的通用信息(类型、值及相关描述信息)或函数的源代码
- IPython中有明确的In(用户输入的指令)和Out(用户输出的指令)字段,用于提示用户输入输出,后面中括号内的数字表示在IPython启动后的命令序号
-
%run命令
- 用于运行.py程序
- %run后加上的python文件,可以在系统的任一目录下
- 如果文件与IPython在同一目录下,就可以直接输入系统的文件名
- 如果文件在系统的其他位置,可以输入绝对路径获得该文件,再通过%run命令执行该程序
- 注意:%run在一个空的命名空间执行%,也就是说,这个程序必须在它的内部包含足够的import变量,使得该程序可以不借助现有的命令空间去执行
-
IPython的%魔术命令
常用命令 说明 %magic 显示所有魔术命令 %hist IPython命令的输入历史 %pdb 异常发生后自动进入调试器 %reset 删除当前命名空间中的全部变量或名称 %who 显示IPython当前命名空间中已经定义的变量 %time statement 给出代码的执行时间,statement表示一段代码 %timeit statement 多次执行代码,计算综合平均执行时间