前 言
人工智能是目前炙手可热的一个领域,多数互联网公司纷纷表示人工智能将是下一个时代的革命性技术。机器学习属于人工智能的一个重要分支,他更偏向于理论,其目的是研究一种为了让计算机不断从大量数据中学习知识,自动实现知识发现和预测,使结果不断接近目标。
实际工作中我们比较常见的是数据分析的概念,他是用适当的统计分析方法对收集来的大量数据进行分析,以求最大化地开发利用数据,从而发挥其商业价值。目前,数据分析已经是一种比较成熟的技术,而机器学习还处于快速发展的过程中,主要依靠算法和数据进行驱动。
在数据分析和机器学习研究热潮中,相关书籍大多偏重于理论。由于Python是开源免费的,而且目前市场上从零基础深入介绍数据分析和机器学习的书籍较少,鉴于此背景,本书基于最新版本的Python 3.10编写,全面而系统的讲解了基于Python的数据分析和机器学习技术。
本书既包括Python数据分析的主要方法和技巧,又融入了机器学习的案例实战,使广大读者通过对本书的学习,能够轻松快速的掌握数据分析和机器学习的主要方法。本书配套资源中包含案例实战中所采用的数据源,以及教学PPT和学习视频,供读者在阅读本书时练习使用。
本书的内容
第1章介绍数据分析的流程和思维,搭建Python 3.10开发环境,以及必会的库。
第2章介绍Python核心基础,包括数据类型、基础语法、常用高阶函数和编程技巧。
第3章介绍如何进行数据准备,包括数据的读取、索引、切片、聚合、透视、合并等。
第4章介绍NumPy基础知识和操作,包括索引与切片、维度变换、广播机制和矩阵运算。
第5章介绍如何利用Pandas进行数据清洗,包括重复值、缺失值、异常值的检测和处理。
第6章介绍Matplotlib绘图参数设置,包括线条、坐标轴、图例、绘图函数和图形整合等。
第7章介绍机器学习及Sklearn库的基本概念、基本流程、主要算法和自带的主要数据集等。
第8章介绍监督式机器学习算法,包括线性回归、逻辑回归、决策树、K近邻和支持向量机等。
第9章介绍无监督式机器学习算法,包括k均值聚类、主成分分析、关联分析和双聚类分析等。
第10章详细介绍机器学习的挑战,模型的主要评估方法,并通过实际案例介绍模型的调优方法。
第11章介绍基于中文的文本分词、关键词提取技术,以及如何生成词向量和进行中文情感分析。
本书的特色
(1)内容全面,讲解详细
本书是一本内容全面的Python专著,由浅入深,详细介绍了基于Python 3.10的数据分析和机器学习技术,包括软件应用与操作的方法和技巧,对于初学者帮助较大,可以使读者通过对本书的学习,能够轻松快速的提高数据分析和机器学习的综合能力。
本书的读者对象
本书的内容和案例适用于互联网、咨询、零售、能源等行业从事数据分析的读者,可以作为Python软件培训的参考资料,也可以作为高校计算机相关专业本科生、研究生的教材或教学参考书。
由于编者水平所限,书中难免存在错误和不妥之处,敬请广大读者批评指正,作者微信公众号:Hanalyst。