一、相关库
机器学习基础阶段会用到Matplotlib、Numpy、Pandas等库
1.Matplotlib
Matplotlib是绘图库,可以绘制函数图、统计图等。专门用于开发2D/3D图表
安装
1.windows:
升级 pip:
python3 -m pip install -U pip
安装 matplotlib 库:(Ubuntu一样)
pip install matplotlib
下载完成后可以在Python文件中
import matplotlib print(matplotlib.__version__)
来测试是否安装成功
pip是python第三方库的管理工具,一般进行安装python的一些库
2.numpy
主要用于高维的数组运算,拥有运算速度快的数学库;
安装
升级 pip:
python3 -m pip install -U pip
安装 Numpy库:(Ubuntu一样)
pip install numpy
下载完成后可以在Python文件中
import numpy print(numpy.__version__)
来测试是否安装成功
3.pandas
关系型、标记型数据的数据分析工具;
安装
1.windows:
升级 pip:
python3 -m pip install -U pip
安装 pandas库:(Ubuntu一样)
pip install pandas
下载完成后可以在Python文件中
import pandas as pd # 导入pandas一般使用别名 pd代替 print(pd.__version__)
来测试是否安装成功
二、Jupyter Notebook
1.Jupyter Notebook
Jupyter项目是一个非盈利的开源项目,逐渐发展为支持跨所有编程语言的交互式数据科学和科学计算。实时运行的代码、叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事。
Jupyter Notebook 相比 Pycharm 在画图和数据展示方面更有优势。
- Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序
- 名字源自Julia、Python 和 R(数据科学的三种开源语言)
- 是一款程序员和科学工作者的编程/文档/笔记/展示软件
- .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范
2.安装
1.windows:(Ubuntu一样)
pip install jupyter
2.配置目录路径
默认打开和保存Jupyter notebook文件目录在C盘。为了更改其默认浏览器和工作地址,可以进行以下操作:
1.打开cmd命令提示符窗口输入:
jupyter notebook--generate-config
# 结果:
Writing default config to: C:\Users\24708\.jupyter\jupyter_notebook_config.py
2.通过上一步得出的位置找到jupyter_notebook_config.py
文件
3.在文件中找到
## The directory to use for notebooks and kernels.
# Default: ''
# c.NotebookApp.notebook_dir = ''
即:用于笔记本和内核的目录
c.NotebookApp.notebook_dir是工作地址,可以设置成你想要设置的地址如:‘D:\Jupyter_Notebook’
记得将注释“#”关掉
3.使用
1.启动
打开cmd命令提示符窗口输入:
jupyter notebook
会直接在浏览器打开,默认地址为:http://localhost:8888/tree
2.新建文件
在浏览器中新建notebook(.ipynb
)文件
还可以创建文件夹、Terminal、txt文本
3.进行操作
在新建.ipynb
文件后可以在该文件的页面输入python语句进行执行。
- 更改文件名可以直接点击该文件页面左上角的文件名进行修改。
- 该页面会自动保存,也可以按
Ctrl+S
保存 - 按
Shift+Enter
执行本单元代码,并跳转到下一单元 - 按
Ctrl+Enter
执行本单元代码,留在本单元
快捷键:
- 编辑模式(
Enter
)- 命令模式下
回车Enter
或鼠标双击
cell进入编辑模式 - 可以操作
cell
内文本或代码 - 代码补全可以按
tab键
- 添加注释为
Ctrl+/
- 命令模式下
- 命令模式(
Esc
)- 按
Esc
退出编辑,进入命令模式 - 可以操作
cell
单元本身
- 按
- 一对
In Out
会话被视作一个代码单元,称为cell
,在In[]
中出现*
则表示当前单元正在运行