JupyterNotebook使用入门
转载请注明出处 😃!
手动反爬:JupyterNotebook使用入门(安装,启动,使用,CODING,MARKDOWN,LSMAGIC,SHORT CUT)
https://blog.csdn.net/Lyun911/article/details/112196204
注:以下使用 MySQL 演示
1 安装 JupyterNotebook
1.1 通过官方Anaconda安装器安装
网址:anaconda.com/distribution
1.2 通过Pip安装器安装
对于已经安装过Python的,可以采用 pip安装器进行安装:
python -m pip install --upgrade pip # 先升级一下pip
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jupyter
注:安装了多个版本python的,要改为 pip3
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple jupyter
2 启动 JupyterNotebook
2.1 启动 JupyterNotebook服务器
方法1:
进入Anaconda Navigator 启动Jupyter服务器
方法2:
通过 pip安装器安装完成后,CMD 运行如下指令进行启动:
MAC系统:$ jupyter notebook
WIN系统:jupyter notebook
2.2 启动 JupyterNotebook完毕
服务器启动完毕后会自动启动一个黑色框体(不要关,这是服务器),同时跳出一个浏览器,界面如下:
3 使用 JupyterNotebook
3.1 基本操作
3.1.1 创建一个笔记本
通过New菜单创建一个新的笔记本
新建后保存,点 File-Close and Halt ,在HomePage中刷新一下就可以看到文件了
文件后缀 .ipynb
中:
i
代表交互式
py
代表这是个python的本子
nb
代表 Notebook
3.1.2 上传文件
之后点击 UPLOAD按钮即可上传
3.1.3 批量关闭打开的文件(FILE选项卡)
绿色的本子(打开的文件显示为绿色)前面打钩 → SHUTDOWN
3.1.4 查看打开的文件(RUNNING选项卡)
3.1.5 并行计算(CLUSTERS选项卡)
做大数据时才会用到,可以同时用几十台机器处理数据(比如数据量在几十GB以上时)
3.2 笔记本的界面说明
笔记本中的Cell类型:
3.2.1 CodeCell:写代码的地方
3.2.2 Markdown:写文本、添加注释等
(注:MarkDown的用法可以参考 CSDN博客写作的指引)
3.2.3 Raw:将笔记本转换成另一种格式的命令行工具
3.3 常规操作
一般使用Notebook会涉及到如下几项操作:
- 笔记本的重命名
- 运行常见Python代码
- 认识常用界面菜单
- 对当前操作环境进行保存和备份
3.4 Jupyter中的神奇功能(%LSMagic 魔术关键字)
Jupyter Notebooks 的开发者已经在其中内置了一些预定义的神奇功能,能让工作更具交互性,我们可以运行下面的命令来查看功能列表:
%lsmagic
%clear
%autosave
%debug
%mkdir
逐行方式:%time a = range(10)
逐单元方式:%%timeit a = range (10)min(a)
3.5 如何使用 nbconvert
应用场景:当写完一个 JupyterNotebook,需要作为 .py
文件给别人,这时候只要转换格式就可以作为 .py
文件给出去了
3.5.1 命令行的方式(CODE)
nbconvert 是常用的转换插件,用于将你的笔记本转换成其他常用的格式:
- TEX:
jupyter nbconvert --to letex notebook.ipynb
- PDF:
jupyter nbconvert --to pdf notebook.ipynb
- HTML:
jupyter nbconvert --to html notebook.ipynb
- MD:
jupyter nbconvert --to md notebook.ipynb
3.5.2 在 Jupyter中操作(GUI)
直接导出(但是要事先安装好PDF等转换包):
当然也可以用win中自带的功能,打印成PDF格式:
4 JupyterNotebook使用小技巧
Jupyter只是一个工具软件,并不是Python或数据分析的代码,这只是一个运行代码的软件框架
一下小技巧只是使用时候的一些习惯和约定
4.1 键盘运行快捷键(SHORT CUT)等快捷操作
处于编辑模式时(在命令模式时按 Enter 会进入编辑模式)常用的快捷键:
- Shift + Enter 运行当行语句
- Ctrl + Enter 运行整个单元块
- Alt + Enter 运行当前的单元块,并在下面添加一个新单元
- Ctrl + Home 到达单元起始位置
- Ctrl + S 保存进度
- Ctrl + Shift + F 打开命令面板
注:要查看键盘快捷键完整列表,可在命令模式按「H」或进入「Help > Keyboard Shortcuts」:
清空所有结果:
运行所有命令:
4.2 常用的编程习惯
在不同的Cell格子中,一般第一部分都会是程序中所需要类库的Import部分,第二部分在数据分析案例中都是用来做数据加载,最后的部分往往是对数据结果进行保存和导出部分,如:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style = 'darkgrid') # 导入要用到包
df = pd.read_csv('fortune500.csv') # 导入要用的数据文件
# etc.
4.3 自动保存功能(CHECK POINT)
在编辑 Notebook的过程中,我们会一直对本子中的内容进行编写,默认情况下每120秒,笔记本会自动保存一次当前文档,使得当前内容会被自动记录。对于需要回退的内容,我们也可以使用返回功能让当前笔记本返回到记录点时候的状态。