翻译

手把手教小白使用Jupyter notebook

   

    Jupyter Notebook是一个开源的Web应用程序,允许用户创建和共享包含代码、方程式、可视化和文本的文档。它的用途包括:数据清理和转换、数值模拟、统计建模、数据可视化、机器学习等等。它具有以下优势:

  • 可选择语言:支持超过40种编程语言,包括Python、R、Julia、Scala等。
  • 分享笔记本:可以使用电子邮件、Dropbox、GitHub和Jupyter Notebook Viewer与他人共享。
  • 交互式输出:代码可以生成丰富的交互式输出,包括HTML、图像、视频、LaTeX等等。
  • 大数据整合:通过Python、R、Scala编程语言使用Apache Spark等大数据框架工具。支持使用pandas、scikit-learn、ggplot2、TensorFlow来探索同一份数据。

    本文中,我们将介绍Jupyter notebook的主要特点,了解为什么它能成为人们创造优美的可交互式文档和教育资源的一个强大工具。在使用这个notebook之前,你需要先进行安装。你可以在Jupyter website上找到完整的安装步骤。(推荐使用Anaconda,自带了Numpy、Scipy、Matplotlib等多种python开发包和Jupyter notebook,在这里附上一个Anaconda的安装步骤《Windows 安装 Anaconda3 详细过程》

    Anaconda安装完毕后,打开Anaconda Prompt:

    在终端运行下列命令jupyter notebook,然后,你将看到类似下面显示的语句,并自动打开浏览器跳出jupyter notebook页面:

    Jupyter的主窗口显示的路径一般是你启动notebook时位于的路径下(通常在你的用户目录下)。主界面如下所示:

 

    若要创建一个新的notebook,只需鼠标左击New,在下拉选项中选择一个你想启动的notebook类型即可。

这里写图片描述

    因为我只安装了Python内核,所以启动Python notebook来进行演示,打开新的标签,得到了一个空的notebook界面。

这里写图片描述

notebook 界面从上而下由四个区域组成:notebook 的名称(点击即可修改)、提供保存、导出、重载 notebook以及重启内核等选项的工具栏、快捷键Toolbar、notebook 的内容编辑区。

下面概述菜单栏各项的主要功能:

 File:

  • New Notebook打开新笔记
    Checkpoint(记录点,类比不同版本)
    Revert to Checkpoint返回到某一个记录点
    Download as: ipynb、py、md、html、pdf

Edit:

  • 包括复制、粘贴、删除、合并、移动等cell区域的操作

View:

  • Toggle Header是否显示头部信息,包括文件名和上次保存时间
    Toggle ToolBar是否显示工具栏
    Cell ToolBar

Insert:

  • Insert Cell Above上方插入一个cell区域
    Insert Cell Below 下方插入一个cell区域

Kernel:

  • Restart和Reconnect相关
    Change Kernel:换Python环境
    Help:一些教程链接

    花时间熟悉菜单,了解其中的选项。如果你想了解一些特殊模块、notebook或者一些库,可以点击菜单栏右侧的Help按钮。

    在主区域(编辑区),你可以看到一个个单元(cell)。每个notebook都由许多cell组成,每个cell有不同的功能。

    首先,第一个cell如下图所示,以“In[ ]”开头表示这是一个代码单元。在代码单元里,你可以输入任何代码并执行。例如,键盘输入1+2,然后按“Shift+Enter”,代码将被运行,并显示结果。同时,切换到新的cell中。

这里写图片描述

    绿色的轮廓线所在的cell,就是当前工作单元。接下来,我们在第二个cell中,敲击下列代码:

for i in range(5):
    print(i)

按“Shift+Enter”运行该单元,得到:

这里写图片描述

    跟之前一样,代码被执行,结果也正确显示处理。但是你可能注意到这次没有Out[2],这是因为我们打印了结果,却没有返回值。

    notebook一个非常有趣的特性是可以返回之前的cell,修改并重新运行,以此来跟新整个文档。例如,现在我们回到第一个cell中,将输入1+2改成2+3,重新按“Shift+Enter”运行该单元,结果被立即更新成5。当你想使用不同参数调试方程又不想运行整个脚本的时候,这条特性非常有用。然而,你也可以通过菜单栏Cell->Run all来重新运行整个notebook。

    现在我们已经知道了如何输入代码,那为什么不尝试获得一个更加优美,解释性更强的notebook呢?这可以通过使用其他类型的cells来获得,例如Header和Markdown单元。

    首先,我们在notebook的顶部添加一个标题。做法是,选择第一个cell,点击Insert->Insert cell above,则在这个cell上面会添加一个新的单元。但是这个新cell默认是code类型,我们可以通过cell type菜单选择Heading或Markdown替换之前的code类型,这样就可以添加标题了。

这里写图片描述

    你可以选择Heading,然后弹出信息会告诉你如何创建不同级别的标题,这样你就有了与code不同类型的cell。

这里写图片描述

    这个cell以#开头,表示一级标题。如果你想列子标题的话,参考下面的方法:

# : First level title
## : Second level title
### : Third level title
...

    标题写在#后面,然后重新运行cell,你会发现该单元添加了标题,非常生动可读,示例如下:

这里写图片描述

    添加标题之后,我们要对每个代码类型的cell做相应的解释。为此,我们在相应的位置添加cell,将其类型改为Markdown,然后重新运行cell,这样就能让解释文本丰富起来了。

这里写图片描述

    最后,你可以将新建的notebook重命名,点击File->Rename,然后输入新的名称即可。这样更改后的名字就会出现在窗口的左上角,位于Jupyter图标的右侧。

    到这里,我们已经基本掌握了jupyter notebook的基础使用方法,在后续更新中,我们将对notebook的能力以及如何集成其他Python库进行更深入的研究。

展开阅读全文

没有更多推荐了,返回首页

博客模板©2019 由CSDN提供 模版主题为:skin3-template by CSDN官方博客 设计