Comprehensive learning path – Data Science in Python

原文:https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-data-science-python/

综合学习路径 - Python中的数据科学

从Python菜鸟到高手之旅

所以,你想成为一名数据科学家,或者可能是你已经是一个,并希望扩大你的工具库。你来到了一个好地方。本文提供了一个使用Python进行数据分析的全面的学习路径。本学习路径提供了一个使用Python进行数据分的的全面的学习步骤。如果你已经有了一些基础知识,或者不需要所有的组件,可以随意调整自己的路径,同事让我们知道你在路径中做了哪些改变。
你还可以查看迷你版的学习路径

第0步:热身

在开始旅途之前,第一个问题就是
为什么用Python,或者,Python如何有用?

第一步:设置你的机器

现在你已经做了决定,是时间设置你的机器了,最简单的方法是从Continuum.io下载Anaconda。它与您将需要的大多数事情一起包装,采取这条路线的主要缺点是您需要等待Continuum更新软件包,即使可能有底层库可用的更新。 如果你是一个起步者,那就不要紧了。
如果您在安装过程中遇到任何问题,可以在这里找到有关各种操作系统的详细说明

第二步:学习python的基础知识

您应该首先了解语言的基础知识,库和数据结构,这里有一个四小时的免费的DataCamp的交互式Python教程,这个教程将教会你怎么用pyhon来研究数据,你应该学会这个教程里的知识。
具体需要学习的部分有:列表,元祖,字典,列表解析,元祖解析
任务,参加DataCamp的交互式Python教程
替代资源:如果你不喜欢这个教程,你也可以看一下python的google课堂,这是一个历史两天的教程,同时也涵盖了后面的一些知识。

第三步,学习正则表达式

因为我是java出身的,对正则表达式也有一些基础,所以我就略过了这部分的学习,如果后续需要的话,在择时加强,此部分的学习可以百度一下,有很多的学习资源。原文给出了一些学习资源,但是需要翻墙上网,所以这里就不在翻译了。倒是有一个小工具挺有意思大家不妨去看看

第四步,学习NumPy, SciPy, Matplotlib and Pandas

这是乐趣开始的地方! 以下简要介绍各种库。 我们开始练习一些常见的操作。

1,彻底地练习NumPy教程,特别是NumPy数组。为今后的学习奠定良好的基础。

教程需要翻墙才能看,或者已经打不开了,但是百度也有很多的教程可以看

2,接下来,看看SciPy教程,看看简介和基础支持,做一些练习
3,Matplotlib
4,十分钟了解pandas ,pandas指导
5,pandas基金提供的的教程

用时你也可以看看pandans做数据分析pandans和数据

其他资源:
如果你想买一本书,推荐Wes McKinney的Python数据分析
这里有一个文档,也可以参考
最终效果,解决这些哈佛的作业


经过一段时间的学习后,对numpy,matplotlib,pandas,也有了一些认识,接着做下一步,我是通过分析基金的数据来学习的,主要学习了matplotlib库。哈佛的作业我没做。

第五步:有效的数据可视化
去看看cs10g的讲座(这个资源没有了),你可以跳过前两分钟,但是后面的部分是非常酷的。另外一个作业

第六步:学习Scikit学习和机器学习
现在,我们到了整个过程的核心阶段,Scikit-learn是python机器学习中一个非常有用的库。这里有概述,看看哈佛cs10g讲座的讲座10到讲座18(翻墙吧),看完后会对机器学习有一个初步的了解,监督学习算法,如回归,决策树,集体建模和非监督学习算法,如聚类等。一些作业

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Over 60 practical recipes to help you explore Python and its robust data science capabilities About This Book The book is packed with simple and concise Python code examples to effectively demonstrate advanced concepts in action Explore concepts such as programming, data mining, data analysis, data visualization, and machine learning using Python Get up to speed on machine learning algorithms with the help of easy-to-follow, insightful recipes Who This Book Is For This book is intended for all levels of Data Science professionals, both students and practitioners, starting from novice to experts. Novices can spend their time in the first five chapters getting themselves acquainted with Data Science. Experts can refer to the chapters starting from 6 to understand how advanced techniques are implemented using Python. People from non-Python backgrounds can also effectively use this book, but it would be helpful if you have some prior basic programming experience. What You Will Learn Explore the complete range of Data Science algorithms Get to know the tricks used by industry engineers to create the most accurate data science models Manage and use Python libraries such as numpy, scipy, scikit learn, and matplotlib effectively Create meaningful features to solve real-world problems Take a look at Advanced Regression methods for model building and variable selection Get a thorough understanding of the underlying concepts and implementation of Ensemble methods Solve real-world problems using a variety of different datasets from numerical and text data modalities Get accustomed to modern state-of-the art algorithms such as Gradient Boosting, Random Forest, Rotation Forest, and so on In Detail Python is increasingly becoming the language for data science. It is overtaking R in terms of adoption, it is widely known by many developers, and has a strong set of libraries such as Numpy, Pandas, scikit-learn, Matplotlib, Ipython and Scipy, to support its usage in this field. Data

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值