数据分析常出现在我们日常工作中,在大模型时代尤其重要,各行各业都需要数据分析。数据分析不仅能够提高决策的质量和效率,还能够揭示数据中的新模式和趋势,帮助企业优化产品和服务,提高运营效率,同时促进业务创新。
如果我们自己也想拥有数据分析的能力,以便更好地适应发展,满足企业或者个人数据分析的需求,我们该怎么办?今天图灵君结合了数据分析的工作流,给大家整理了一份保姆级书单,旨在帮助大家更好地自学数据分析。这几本书不仅豆瓣评分高,其中的几本还得到了互联网大佬推荐,如果你正在入门,这些书不容错过!
数据分析思维
《精益数据分析(珍藏版)》
阿利斯泰尔·克罗尔、本杰明·尤科维奇|著
韩知白,王鹤达|译
网易创始人丁磊曾发动公司全员学习本书,精益创业运动开创者埃里克·莱斯作序推荐。全书汇聚了 100 多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。
统计学基础
《贝叶斯数据分析(第2版)》
约翰·K. 克鲁施克 | 著
王芳 | 译
如果你认为统计学很难,或许是因为你在入门时错过了本书。本书篇幅大、内容全,其可读性却出人意料地高。作者从概率与程序设计的基本概念出发,带你逐渐掌握实际数据分析中常用的高级模型。你会知道,入门贝叶斯统计并不需要天赋或魔法,只需一页一页地跟随本书学习即可。
本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型
《用Python动手学统计学》
[日]马场真哉 | 著
吴昊天 | 译
文科生也能学会的统计学入门书!内容充实,涵盖与数据打交道的人都需要的统计学知识,从统计学的基本概念和 Python 基础知识讲起,到使用 Python 进行分析的方法、统计模型和机器学习,层层深入,帮助读者把握统计学的全貌。文字、公式、代码多角度讲解,让统计学不再难 写法巧妙,对同一个知识点,分别从文字、公式、代码 3 个角度进行解读,帮助读者加深理解。多个小标题分别带有“术语”“实现”“补充”等标记,方便读者查找、学习。
数据收集
《Python网络爬虫开发实战(第 2 版)》
崔庆才 | 著
Python 之父 Guido van Rossum 推荐的爬虫入门书,第 1 版销量近 100000 册。本书介绍了如何利用 Python 3 开发网络爬虫。本书为第 2 版,相比于第 1 版,为每个知识点的实战项目配备了针对性的练习平台,避免了案例过期的问题。
另外,主要增加了异步爬虫、JavaScript 逆向、App 逆向、页面智能解析、深度学习识别验证码、Kubernetes 运维及部署等知识点,同时也对各个爬虫知识点涉及的请求、存储、解析、测试等工具进行了丰富和更新。
数据预处理
《数据预处理从入门到实战:基于SQL、R、Python》
本桥智光 | 著
陈涛 | 译
54 道例题,涵盖常见数据预处理技术,3 个实战案例,快速提升应用能力。3 种语言实现对比,代码优化关键点一目了然。配套数据+源码可下载,一本书掌握大数据、人工智能时代需要的数据预处理技。
全书共 4 个部分:第 1 部分介绍预处理的基础知识;第 2 部分介绍以数据结构为对象的预处理,包括数据提取、数据聚合、数据连接、数据拆分、数据生成和数据扩展;第 3 部分介绍以数据内容为对象的预处理,涉及数值型、分类型、日期时间型、字符型和位置信息型;第 4 部分为预处理实战,介绍与实际业务相同的预处理流程。
数据分析工具
《SQL必知必会(第5版)》
本·福达 | 著
钟鸣,刘晓霞 | 译
SQL 入门必备,畅销多年,中文版累计销量超 15 万。本书没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从 SQL SELECT 开始,讲述实际工作环境中常用必备的 SQL 知识,实用性极强。第 5 版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
《Python编程:从入门到实践(第3版) 》
[美]埃里克·马瑟斯 | 著
袁国忠 | 译
Python 入门圣经,影响全球超过 250 万读者,长居 Amazon、京东等网店编程类图书榜首,真正零基础,附赠随书代码+配套视频讲解+速查手册,自学无压力。
《Excel+Python:飞速搞定数据分析与处理》
[瑞士]费利克斯•朱姆斯坦|著
冯黎|译
流行 Python 库 xlwings 创始人亲授,教你让 Excel 快得飞起来。办公人士零压力学 Python ,轻松突破 Excel 瓶颈,拓展解决问题思路。让你告别烦琐公式和 VBA 代码,将 Excel 任务自动化,实现效率飞跃。让 Excel 和 Python 珠联璧合,避免人为错误,精准完成数据处理。
《R语言实战(第3版)》
罗伯特 · I. 卡巴科弗 | 著
王韬 | 译
豆瓣评分 9.2,作为 R 语言的经典教程,这本书帮助读者轻松上手。新版全面扩充 ggplot2、tidyverse、 RStudio、R Markdown 用法。
《利用ChatGPT进行数据分析》
张俊红|著
10 万册畅销书作者,根据 ChatGPT 在数据分析各个阶段的应用情况,按照数据分析师的职业发展路径展开,带你快速上手高效运用 ChatGPT 进行数据分析。
数据可视化
《用数据讲故事(修订版)》
[美]科尔·努斯鲍默·纳福利克|著
陆昊,吴梦颖|译
作者科尔是数据分析领域的“传奇”,她创立的 storytellingwithdata 博客及其思想从某种程度上重塑了人们对于数据分析与传达的认识。
本书授人以渔,介绍了专业商业图表背后的六大潜在规律。以讲故事的思路传达图表中的信息,是提升沟通效率的有效方式。大道至简,只需稍作调整,就能点石成金,改善图表与沟通效果。
《大话数据分析》
高云龙,孙辰 著
这是一本 Tableau 实战指南。由 Tableau 中国资深专家、亚马逊资深商业智能经理倾力打造。书中通过模拟实际工作场景,用对话形式一步步讲解 Tableau。
作者讲述了一个现代企业从最初的报表开发模式转向敏捷型分析模式的故事,通篇以对话的形式模拟职场人员在日常工作中使用数据分析解决问题并进行业务决策的过程。内容由浅入深,从一开始就带入到实际的业务分析应用中,每一章都在使用 Tableau 分析和解决实际商业中遇到的问题。