数据科学导论python语言实现_数据科学导论-python语言

一直想找一本数据科学的书,为信息管理专业的学生来用,赵了国内数据科学技术与应用,太笼统了,没有专业性,找了吴喜之的python-统计人的视角,又觉得数据科学的东西少了,所以一直在找教材中。

这次机械工业出版社翻译的这本数据科学导论感觉不错,作者是意大利人,一直没有体验下意大利民族的特点,这次体验下。

首先,阿尔贝托是信号处理以及统计学的,主要作自然语言处理的,这个背景其实做数据科学还是不错的,有技术背景以及有一定的行为学背景。另一个卢卡,是市场研究和多元统计分析的专家,主要是客户分析的。这两个人的组合还是比较符合数据科学的背景的,我一直不喜欢纯计算机专业的作为数据科学的研究者,太计算机化了,按照我们有些老师的说法就是,太喜欢用计算机来处理问题了,认为计算机是万能的。

由于数据科学是以问题为导向的,我们最重要的是要认识问题,这样才能使用或是改进某些东西来使计算更好或是更快。所以有社会科学背景的数据科学家写的书更容易被人理解。

不说废话,这个是这本书给我的第一印象。

我看过很多数据科学的教材,都是讲半天,然后慢慢导入numpy,pandas,matplotlib,等等等等,很慢,这本书就是一开始讲一下anaconda的安装,然后直接上数据。

上了数据就是pandas,这个是必须的,如何处理数据,如何预处理,如何访问其他数据格式,抓取数据都说了,虽然很简单,但是老齐的课也是这样来的。然后就是numpy,都是针对数据分析的,这个是基础,还不错。

接下来接着就是PCA,异常检测,超参数优化的问题,这个可是处理完数据后接着就要做的事情,很切合实际应用的处理,感觉就是有经验的人写的书,不是学院派。

后面就是机器学习,这个都差不多了,和其他的书感觉一样,说实话,真的就是没什么特别的东西的,数据科学就那些算法,熟悉一本书就可以了啊。最后就是可视化,matplotlib就登场了。

本书还有一个特点就是带了Spark的大数据分析,感觉写出来了,但是不尽兴。毕竟这个一本书肯定讲不完。

综合而论,这本书却是适合本科教学的,大数据专业,数据科学专业都可以的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值