利用python进行数据分析第一版和第二版区别_013【数据分析】利用Python进行数据分析 第二版 (2017) 中文笔记...

中期回顾:10月下旬我就开始在做这本书的笔记,现在三周过去了,这期间发生了很多事,但终于,终于,完成了一半……

不过,起码现在已经完成了一半,总算是有点底气贴出来以飨读者。

写中文笔记比我想的要花时间,不过这个笔记有两个好处:

1. 适合英文不好的初学者拿来练习。我已经尽量翻译成中文了,对于英文不好的同学更友好一些;

2. 可以直接当字典来索引,以后遇到问题直接找对应的章节,不用到处问来问去。

2017第二版主要更新:

1. 所有代码,包括Python教程,都升级到了Python3.6(第一版用的是Python2.7)

2. 更新了Python的安装介绍。这次改用Anaconda Python发行版,以及其他一些需要的Python包

3. 使用了最新的2017版pandas

4. 新增了一章,用来介绍pandas的高级应用工具,和其他一些有用的小贴士

5. 简单介绍了如何使用statsmodels和scikit-learn

如果使用python做数据分析的程序员,我想应该没有人不知道Python for Data Analysis(利用Python进行数据分析)这本书。

自从这本书2013年第一版发行后,就广受好评,尤其是搞数据科学的,这本书可以说是必读书籍了,里面对于pandas进行了重点的介绍,并辅以numpy,matplotlib等包进行说明,里面的内容完全可以让一个小白学会用python进行一般的数据分析任务。

最近时间多了些,本来打算把这本书完整过一遍,不过在做第三章的笔记时,发现作者已经在2017推出了第二版,不过现在还没有中文版。 所以这里我打算直接把书里的内容翻译成中文,做一个简洁的中文笔记版本(Jupyter Notebook)。

这本书第一版的时候使用的语言是Python 2,不过随着Python2的维护年限将近(2020),以及Python3的推广,整个社群向Python3转变已经成为不可扭转的趋势。 所以在第二版里,作者使用了Python3.6。而我实际写的代码则是基于Python3.5,实际使用过程中没有什么差别。

在写笔记的时候,我尽量写中文,不过有一些专有名字我是直接写英文,然后配上中文翻译,毕竟有时候知道英文单词的话查找英文的文档也方便一些,而且我相信这样做对提升中文和英文专业名字的对照关系有帮助。毕竟在程序员的世界里,不懂英语会很艰难,即使是一些简单的单词,也是我们走向新世界的起点。

如果觉得有帮助的话,就点个Star吧:)吐槽

这个专栏终于要写一点关于编程的东西了……本来就是打算以深度学习为主题创建的专栏,结果完全没有分享技术的东西,现在终于对回到正轨感到了一丝欣慰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值