Python编程数据分析篇之基本介绍
文章目录
数据分析介绍
数据分析基本概念
- 用适当的统计分析方法对收集来的大量数据进行分析
- 提取有用信息和形成结论
- 对数据加以详细研究和概括总结的过程
数据分析的流程
为什么要学习数据分析
- 岗位有需求
- 是机器学习的基础
- 数据科学的基础
数据分析工具
注意
- 数据分析与数据挖掘的相似之处
数据挖掘和数据分析都是对数据进行分析、处理等操作,从而得到有价值的知识 - 数据分析与数据挖掘的区别
- 在应用工具上,数据分析更多的是借助现有的分析工具进行,而数据挖掘一般需要通过编程来实现。
- 在行业知识方面,数据分析要求对所从事的行业有比较深的了解,更多的是将数据与业务紧密结合起来;而数据挖掘不需要有太多的行业知识,更专注于技术层面。
环境部署
- Pycharm
- jupyter
Jupyter介绍
Jupyter Notebooks是什么
Jupyter Notebooks是一款开源的网络应用,我们可以将其用于创建和共享代码和文档。其提供了一个环境,你无需离开这个环境就可以在其中编写代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。
Jupyter Notebooks特点
- 基于web的在线编辑器
- 可交互式
- .ipynb文件共享
- 支持markdown
Jupyter安装
- 如何安装Jupyter Notebooks
首先需要在电脑上安装Python(建议Python3.6或3.7)。
安装命令:pip install jupyter
Jupyter使用
- 如何运行Jupyter Notebooks
- 首先需要建立单独项目文件夹(建议名称不要包含中文)
- windows+R输入cmd进入windows终端
- 切换到该文件夹路径下
- 打开命令:jupyter notebook
Jupyter Notebook快捷键使用
- 运行:Ctrl + Enter(不往下添加单元块);Shift + Enter(运行完之后自动往下添加一个单元块)
- Esc --> 命令模式
- Enter --> 编辑模式
进入命令模式之后快捷键
- A :在活跃单元之上插入一个新单元
- B:在活跃单元之下插入一个新单元
- 连续按两次D:可以删除一个单元
- Z :撤销被删除的单元
- Y:会将当前活跃的单元变成一个代码单元
- 按住shift + 上或下箭头可选择多个单元。在多选模式下,按住shift + M可合并你的选择。
进入编辑模式的快捷键
- Ctrl + Home:到达单元的起始位置
- Ctrl + S:保存进度
- Ctrl + Enter:运行整个单元块
- Alt + Enter:不止会运行当前单元块,还会往下面添加一个新单元块
以上快捷键,进入命令模式,摁住H就可以看到快捷键了。