数据科学概览
一般我们掌握前面三个模块,就业基本没有问题。通过爬虫爬取大数据,然后Django做出网页,将数据可视化,最中间核心的是数据分析的清洗处理。numpy,panda,matplotlib,数据分析的三剑客。再后面的特征处理,模型训练,对应的就是机器学习。
前三个模块学好了,对应的岗位就是图2的前两个。
jupyter notebook
在想要保存的目录下,运行jupyter notebook。好处:1,加载快,是一个网页形式。2,每个cell,是一个独立的小格子,可以自己在格子内修改,然后单独运行这一个各自。shift+enter。3,也可以全部运行一遍,从上到下。4,甚至于,在某些需要的时候,可以颠倒上下运行的顺序。
但是,jupyter notebook文件不会自动保存,我每写完一个cell后,最好用ctrl+s保存一下。
在命令行中,要结束当前命令,ctrl+c。
同时,jupyter中也可以写markdown,这种文档格式。