Jupyter Notebook
Jupyter Notebook是一个基于网页的交互式计算环境,是数据分析、数据科学甚至机器学习领域里非常流行的一款工具,可以用来编写代码、运行代码、查看输出、可视化数据并分享输出的报告文档。
我们在之前的python学习里,一般使用的是代码编辑器,比如PyCharm或VSCode等来编写以.py结尾的Python代码文件。那为什么搞数据或算法的人更喜欢用 Jupyter Notebook呢?
第一个好处是Jupyter Notebook可以按单元格运行代码,用编辑器写普通代码文件时,每次点运行,Python解释器会把代码从开头一直运行到结尾。但对搞数据的人来说,我们不是所有时候都想从头运行到尾,数据量特别大的时候,读取数据等几秒,清洗数据要等几秒,每次修改公式分析想反复运行查看效果的时候,不希望前面没有改动的步骤还要反复被运行,因为这样会很浪费时间。Jupyter Notebook就很简单啦,我们可以把不同的步骤放在不同的单元格里,每运行一个单元格的代码,这样我们就可以只读取一遍数据,而反复修改和运行分析代码时读数据代码就不会再被运行了。
第二个好处是它支持展示更丰富的信息格式。分析数据时需要记录和解释很多东西,例如数据的背景、使用的公式、分析思路等等。Jupyter Notebook可以用Markdown标记语言,让注释更加清晰有层次,还可以用LaTex插入公式。
第三个好处是Jupyter Notebook提供了交互模式环境,我们平时在编辑器写和运行Python文件时用的是命令行模式。交互模式相比命令行模式的好处是查看输出时不需要加上打印语句就能看到。
安装Jupyter Notebook
W