1-1 数据分析介绍
数据分析介绍
数据分析基本概念
• 用适当的统计分析方法对收集来的大量数据进行分析
• 提取有用信息和形成结论
• 对数据加以详细研究和概括总结的过程
数据分析的流程
目的明确——准备数据——数据解析——分析数据——获得结论——成果可视化
为什么要学习数据分析
• 岗位有需求
• 是机器学习的基础
• 数据科学的基础
数据分析工具
工具:excel,tableau,spss
编程语言:R,Python,Matlab
注意
数据分析与数据挖掘的相似之处:
- 数据挖掘和数据分析都是对数据进行分析、处理等操作,从而得到有价值的知识
数据分析与数据挖掘的区别: - 在应用工具上,数据分析更多的是借助现有的分析工具进行;而数据挖掘一般需要通过编程来实现。
- 在行业知识方面,数据分析要求对所从事的行业有比较深的了解,更多的是将数据与业务紧密结合起来;而数据挖掘不需要有太多的行业知识,更专注与技术层面。
环境部署
• Pycharm
• jupyter
1-2 Jupyter使用
Jupyter介绍
Jupyter Notebooks 是什么?
Jupyter Notebooks 是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。
其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。
Jupyter Notebooks特点
• 基于web的在线编辑器
• 可交互式
• .ipynb文件分享
• 支持markdown
Jupyter安装
如何安装 Jupyter Notebooks?
- 首先需要在你的机器上安装 Python。(建议python3.6-3.7都可)
- 安装命令:pip install jupyter
Jupyter使用
如何运行 Jupyter Notebooks?
1.首先需要建立单独项目文件夹(建议名称不要包含中文)
2.windows+R输入cmd进入windows终端
3.切换到该文件夹路径下
4.打开命令:jupyter notebook
如图所示: