转行数据分析两年,走过的坑、读过的书…

在上次分享了 “我放弃了国企工作,转行做了数据分析”(此处添加链接)之后,有朋友分享了学习数据分析中的疑惑:
学习SQL,该看哪些书?
学习Python,该看哪些书?
学习R语言,该看哪些书?
辞职自学数据分析,值得吗?
没有数据分析经验,面试通过率很低,怎么办?
……
数学君不得不承认自己在刚转行做数据分析时也遇到过这些问题,所以和朋友们分享一下自己走过的那些坑,希望朋友们能因此少走些坑 。

入坑1:要学数据分析,必然从主流的Python语言起步?

在决定转行做数据分析后,数学君就开始学习Python,在把Python的基础知识学完后(这部分感觉比较简单,因为之前学过C、R),自己做了几个简单的项目。然后。就开始了数据分析的求职之旅。
但无奈,当时在一个新一线城市求职,数据分析岗位要求基本都偏计算机方向,仅会一点Python显然是不行的。好不容易得到一个对计算机技能要求低一点的面试机会,因为没有经验,自然面临压低工资的境遇,第一次面试就失败了。
在新一线城市碰壁后,转战一线城市,一线城市的数据分析工作机会要比新一线城市多很多,数据分析岗位的技能要求也有较大差异。但对于没有数据分析经验,计算机方面技能缺乏的我来说,要求技能以SQL语言、Excel、PPT为主、Python和R等语言为辅的岗位成了我的首选,也是我从事的第一份数据分析岗位。
数学君从第一个坑得出的结论是:对于没有数据分析经验、算法知识和计算机背景的朋友来说,从SQL起步,可能是个不错的选择。
原因有二:一是SQL上手比较快,经过1个月左右的学习和实践基本可以掌握查询的技能;二是省去了冒着辞职的风险学习数据分析,等学完发现还是不一定有合适的岗位(现在的求职环境你懂得)。

入坑2:开始自学时,读两三本书可以学会数据分析的一门语言?

要开始学习一个新的领域,第一步必然是选择合适的学习材料。在开始学习Python时,无知的我以为两三本书可以学会Python,于是就想找一些内容覆盖全面的书,甚至是能达到从入门到实践的程度。
当然,市面上从入门到实践的书特别多。但实际上没有一本Python的书可以让一个零基础的初学者掌握他所梦想掌握的所有数据分析技能的,三本书也不可能。每一本写着从入门到实践的书也只能帮助读者实现在某一方面从入门到实践。
Python的内容很多,功能很强大,应用也极为广泛,所以在学习Python时需要先确定自己最需要掌握的技能,然后再选择书籍。比如Python基础、Python数据分析、Python算法、Python爬虫等每个都可需要一本书的篇幅来讲。
明确自己的水平、确定好目标后,相信你可以选择一本适合自己的Python书籍了。
简单附一个数学君在近三年学习数据分析的过程中读过的书单及每本书的特点,希望对初步学习Python的朋友有帮助(PS:绝无推销之意,自己还没有推销需要的流量)。

读过的数据分析书单(也有走过的坑)

Python部分

  1. 《Python编程 从入门到实践》,[美] 埃里克·马瑟斯(Eric Matthes) 著,袁国忠 译,中国工信出版集团,人民邮电出版社
    这本应该是Python零基础的学习者接触最多的一本书。
    “第一部分 基础知识”是每一个Python初学者必须要学习的,这一部分很通俗易懂,但基础练习比较多。所以如果时间紧,可以省去一些练习。
    “第二部分 项目”就因人而异了,数据可视化、游戏设计、用户账户等都用了详细的例子来介绍,但如果你的目标只是数据分析,而且时间紧迫度较高,此部分可以适当放弃对几个项目学习。
  2. 《PYTHON数据科学与机器学习:从入门到实践》,(美)凯恩 著, 人民邮电出版社
    统计概率、Matplotlab画图、机器学习、推荐系统等都有涉及,但并不全面,适合已经具有Python基础知识,但需要初步学习Python数据分析的读者。
  3. 《利用Python进行数据分析》[Python for Data Analysis: Data Wrangling with Pand] (原书第2版) [美] 韦斯·麦金尼(Wes McKinney) 著,徐敬一 译机械工业出版社
    毫无疑问,这本书是专门讲Python数据分析的。前面三章主要是Python基础知识,后面讲的Python中两个重要的库“Numpy和pandas”在数据分析中的应用(其作者也是Python软件中Numpy和pandas的作者)。
    对重在学习Python数据分析的朋友来说,这本书可以说是必读的。
  4. 《Python算法教程》 [挪威] 赫特兰(Magnus Lie Hetland) 著;凌杰,陆禹淳,顾俊 译;中国工信出版集团,人民邮电出版社
    学习算法的入门书籍,算法时间复杂度、各种经典算法都有涉及。
    这本书侧重的是算法理论和复杂度,而非程序编写,需要读者有一定的Python基础,不适合Python初学者。
  5. 《推荐系统实践》,项亮 著,人民邮电出版社
    毋庸置疑,这本书是讲Python推荐算法的。现在社交网站、娱乐、电商都离不开推荐算法。这本书还是比较适合对推荐算法感兴趣的朋友的,用户行为分析、用户标签、基于图的推荐算法、评分预测等内容在这本书中都有详细介绍。

R语言部分

  1. 《R语言实战 第2版》,[美] 卡巴科弗(RobertI.Kabacoff) 著;中国工信出版集团,人民邮电出版社
    覆盖了R语言基础知识(数据结构、图形和数据可视化)、初级统计分析、中级统计分析(回归模型、方差分析)、高级统计分析(广义线性模型、主成分分析和因子分析、时间序列模型、聚类)等,可以说基本覆盖了R语言在数据分析中的各个方面。
    除了覆盖内容全面外,讲解的非常清晰,既有对统计和R语言基础知识、原理的讲解,也有实战项目演练。适合初学者,也适合中级水平的读者。
    学习这本书一定要静下心来,耐心学习,不要被书中庞大的知识量給吓到了。内容非常多,文字也比较多,也正因为如此,才把一切解释的那么清楚。数学君在第一次读这本书的时候,确实觉得有点困难,中途转换到了其他知识量少但原理解释不是那么清晰的书,但最后觉得还是这本书对学习R语言数据分析的帮助最大。

  2. 《R语言入门与实践》,格罗勒芒德(Garrett Grolemund) 著,冯凌秉 译,中国工信出版集团,人民邮电出版社
    优点:通俗、项目有趣(如掷骰子游戏、扑克牌项目、老虎机项目)。
    缺点:虽然说是入门图书,有入门知识但不全面;即使对初学者来讲,对统计知识和R语言的介绍也不够。

  3. 《数据科学:R语言实现》,[美] 丘祐玮(David Chiu) 著,魏博 译,机械工业出版社
    看书名就知道,这本书是侧重实战的,不适合初学者。
    优点是:项目比较有意思(时间序列模型-股价预测、决策树模型分类等),章节名称比较吸引人,R语言的应用介绍也比较全面(监督式学习、非监督式学习等,其实是回归模型、聚类分析等)。
    缺点是:侧重代码实现,原理讲解较少。先讲代码步骤,最后讲原理实现,也不太方便对应。

  4. 《数据科学:理论、方法与R语言实践》,[美] 尼娜·朱梅尔Nina Zumel 著;于戈,鲍玉斌,王大玲 译,机械工业出版社
    侧重项目管理、建模、机器学习,内容量相对覆盖的范围较小,可以作为数据科学的入门书籍,不适合进阶深造。

SQL部分

  1. 《MySQL 5.7从入门到精通》,刘增杰 著,清华大学出版社
    适合初学者,内容非常全面。基础知识部分包含了数据库基础、MySQL基础和使用过程中常遇到的基础问题、数据库操作、函数、索引以及数据库设计。个人认为如果是仅做数据分析,数据库设计部分可以忽略。
  2. 《MySQL必知必会》[MySQL Crash Course] [英] 福塔(Ben Forta) 著,刘晓霞,钟鸣 译,人民邮电出版社
    适合初学者,内容覆盖了数据库基础、数据库操作、函数、索引、数据库维护等,语言生动、通俗易懂。
    呈现方式与一般的工具书不太相似,重在通过有趣的例子,引出知识点。例子占的篇幅较大,知识点做成小结的形式。如果你习惯按照传统的知识点、练习格式快速学习,这本书内容的呈现方式就不太适合你了。

学习数据分析不易,转行做数据分析更不易。**公众号“数学算法的世界”**记录了数学君数据分析的学习笔记、实战演练和学习总结,期待与志同道合的朋友共同交流、成长、进步。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值