数据科学与Python
深度学习/人工智能
google:tensorflow
facebook:pytorch+caffe2
Amazon:mxnet+gluon
百度:paddlepaddle
非常容易上手的一些package:Keras Tflearn tensorlayer
机器学习
numpy scipy pandas scikit-learn xgboost/LightGBM
大数据
大数据整体是由Java/scala等语言主导的方向,但是目前有很多python的方式可以无缝衔接使用,从早期的hadoop生态可以通过hadoop streaming使用python脚本完成Map-Reduce任务,到现在大家都在广泛使用的spark也有python的接口,而且在效率上和其他语言并没有太大的差别。
原因
时间非常宝贵,“算法工程师”、“数据科学家”需要用数据驱动的方式去解决实际生活中的各种问题,但是花大量的时间去开发不是一个很高效的方式,理想的状况是,你把主要的精力放在分析业务场景和数据,找到更好更贴切的方式解决问题本身上,而快速地coding验证或者开发服务。