全文共4659字,预计学习时长12分钟
图源:unsplash
在开始一项数据科学项目时,我们通常需要进行设置或配置,以确保所需的依赖关系,保持输出稳定,准备通用函数。
项目设置的一个案例(来自Handson-ML2)
本文将介绍JuypterNotebook中最有帮助的一些项目设置。
1.确保Python版本
检查JupyterNotebook中的Python解释器版本:
import sys
sys.version'3.7.6 (default, Jan 8 2020, 13:42:34) \n[Clang 4.0.1 (tags/RELEASE_401/final)]'
为确保项目由Python解释器的最低及以上要求版本运行,可在项目设置中添加以下代码:
# Python ≥3.7 is required
import sys
assert sys.version_info >= (3, 7)
Python需要为3.7及以上版本,否则会抛出AssertionError。
2.确保程序包版本
检查安装的程序包版本,如TensorFlow。
import tensorflow as tf
tf.__version__'2.0.0'
确保项目是由TensorFlow2.0及以上版本运行的,否则会抛出AssertionError。
# TensorFlow ≥2.0 is required
import tensorflow as tf
assert tf.__version__ >= "2.0"
3.避免绘制模糊图像
JuypterNotebook中的默认绘图看起来有些模糊。例如,一张查找缺失值的简单热图。(https://towardsdatascience.com/using-pandas-pipe-function-to-improve-code-readability-96d66abfaf8)
import seaborn as sns
i