影响最大的七本工具书

哪本计算机书籍,让你有了醍醐灌顶突然开悟的感觉?

用代码构建世界

1️⃣ 写在前面

简单介绍一下自己的背景

首先,我现在是杭州某互联网公司资深数据分析专家,在传统行业、物联网、互联网摸爬滚打了11年,现在带着一个分析团队;

然后,我是一个python重度使用者,从2012年开始接触python2.3到如今,也10年有整,可以说python改变了整个职业生涯,把繁琐的事情模板化、案例化,能一键搞定;

最后,虽然我现在coding写的越来越少,但我还是认为在互联网时代,每个人都应该熟练掌握1~2门计算机语言(Python),提高效率和产出,降低个人被毕业的风险;​​​​​​​

2️⃣ 从月薪1200到年薪百万,影响最大的七本工具书

翻了翻我以前的书单,也算是从萌新小白到资深专家的进阶史

书名

推荐理由

《R语言与统计分析—汤银才》

了解统计学

《统计建模与R软件—薛毅》

计量统计的最好案例实践

书名

推荐理由

Python Cookbook(第3版)

了解Python的基础常用函数

《利用python进行数据分析》

python的基础语法介绍,少案例

《Python数据科学手册》

适合BA、DS的python操作指南

《Python数据科学项目实战》

25个案例,利用python进行数据分析之后的进阶版

《机器学习-周志华》

🍉西瓜书,机器学习经典教材

机器学习实战:基于Scikit-Learn和TensorFlow

了解机器学习和深度学习

《交通时空大数据分析、挖掘与可视化》

一个完整的项目级应用,滴滴、字节、阿里常用

📌 基础类

《Python Cookbook(第3版)》 

《利用python进行数据分析》

📌 进阶类

《Python数据科学手册》 

《Python数据科学项目实战》

数据科学,包含了对问题事件的分析、挖掘,需要用到很多前沿的算法,譬如机器学习、深度学习,涉及到的代码、算法、数据集、格式和可视化都需要有完整的项目进行演练,才能实现互联网短平快的目的,高效高产。

结合BAT下企业级5个真实的应用案例,譬如根据新闻标题跟踪疾病暴发、分析社交网络以及在广告点击数据中寻找相关模式,通过分析需求转化,了解常见问题的解决,例如数据丢失、混乱的数据以及与构建模型不匹配的算法,Python算法包中的详细设置说明和常见故障的解决办法,利用简单示例实现算法原理的理解与落地应用。

通过完成这些项目,了解数据在时间、空间上对物理世界的数字还原,发现更多的商业机会点。

📌 实战类

5、《机器学习-周志华》 

6、《机器学习实战》 

7、《交通时空大数据分析、挖掘与可视化》

虽然书名是叫交通时空大数据,但实际上在现有互联网、IOT背景下,终端采集回来的埋点数据中,都会带有GIS相关的数据,即是是离线地址库,也需要定位到空间地理位置查看区域分布。

通过对时间、空间的深度剖析与挖掘,对用户受众的轨迹行为进行数据仿真,找到群体聚集点、地方区域分布、行为交集,在商业战略布局过程中,可以支撑起快速选点、仓储设置、物流运输、线路设计等业务拓展

本书针对不同的学习阶段与业务需求设计了三个部分:基础篇,应用篇与方法篇,共十五章。

► 基础篇,梳理Python数据分析、网络爬虫、数据可视化、地理信息等基础知识;

► 应用篇,介绍出租车GPS数据、IC刷卡数据、公交GPS数据、共享单车订单数据等各类时空大数据的实际案例应用;

► 方法篇,融汇数据挖掘、空间统计、复杂网络学科等交叉学科方法与交通领域的大量实际案例分析结合,全面梳理总结交通时空大数据所需跨学科技能。

本书作者依托书中所介绍的相关技术开发了Python开源库TransBigData,该库面向交通时空大数据分析不同阶段的处理需求,以简洁、高效、灵活、易用的代码实现复杂的数据处理任务。

3️⃣ 工具在数据价值上的促进作用

🔺 浅谈商业和数据的本质

商业的几个本质:信息差、认知差(理解差)、执行差、圈层差(资源差)

随着互联网、物联网(IOT)的发展,某种程度上极大的缩小了信息差的存在,但是认知差依然存在。

再说说数据分析的本质,离不开三个大的要素:「时间 + 空间 + 人事物」

在企业数据分析中,到目前很少再只对单一指标做衡量,而是引入更多的特征进来,加上时间趋势、空间构成对人 / 事 / 物进行业务上的数据阐述,以实现数字仿真,还原一个客观的物理世界。

时间类——趋势

空间类——构成

人事物——归因

🔺 技术的迭代让静态的数据「活」起来了

在10年前,互联网数据分析刚火起来的时候,都是围绕着网页或者APP上的海量用户行为、埋点点击展开的转化分析,

Graph

Funnel

GEO/MAP

User Persona

在5~6年前,随着IOT的渗透,智能化设备让数据可分析的维度变得更宽更广,通过终端采集到的用户信息,结合不同时间下的地理GIS变化,就能还原物理世界中的空间行为轨迹。

这对于商业机会来说非常需要,定位到人群密集的地方,找到行为上人群密度大、交集多、停留时间长、人群净值高的那些区域,在选点、投放、布局等场景都有非常强的应用,用空间去节省时间,会极大程度上的去影响后续的业务布局。

4️⃣ 写在最后

通过几行python代码,实现复杂网络工程级的数据探索和查看,对于互联网、物联网从业的人来收,必不可少。

如果自己不会,也可以让自己下面的人(如有)搞起来,或者找到一个周边会的小伙伴,绝对是一大快乐源泉,省下来的时间,就可以去走走逛逛,看看这个大好世界的冰川、山脉和江海。

电子书虽好,实体书更赞,支持原著才会让知识变得更加有价值。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郑小柒是西索啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值