从零开始学Python数据分析与挖掘
文章平均质量分 97
本专栏内容来自从零开始学Python数据分析与挖掘
SunnyRivers
在通信、游戏、互联网、新能源等不同行业从事过多年大数据开发相关工作,想通过博客和大家一起分享大数据技术带来的经验和乐趣。
展开
-
第一章数据分析与挖掘概述
前言马云曾说“中国正迎来从IT时代到DT时代的变革”,DT就是大数据时代。随着移动互联网的发展,人们越来越感受到技术所带来的便捷,同时企业也将搜集到越来越多与用户相关的数据,包括用户的基本信息、交易记录、个人喜好、行为特征等。这些数据就相当于隐藏在地球深处的宝贵资源,企业都想从数据红利中分得一杯羹,进而推进企业重视并善加利用数据分析与挖掘相关的技术。本章将以概述的形式介绍数据分析和挖掘相关的内...转载 2019-07-04 22:34:01 · 3433 阅读 · 2 评论 -
第二章从收入的预测分析开始
前沿在数据分析与挖掘过程中,预测性或分类性问题往往是企业需要解决的主要问题,例如下一季度的营收可能会达到多少、什么样的用户可能会流失、一场营销活动中哪些用户的参与度会比较高等。本章将通过Python语言,以一个实战案例介绍分类性问题的解决步骤。通过本章的学习,你将会了解到基于Python的数据处理和建模方法:外部数据的读取;数据的预处理;数据的探索性分析;数据建模;模型预测与评估。...转载 2019-07-04 23:11:32 · 3856 阅读 · 3 评论 -
第三章Python快速入门
前言本章重点介绍有关Python的基础知识,这是每一个Python用户所要走过的必经之路,因为任何一段Python代码中都会包含一些基础知识。对于读者来说,只有基础夯实牢了,在之后的代码编程中才会轻松自如。如果你是从零开始的Python用户,希望能够认真学完本章的Python入门基础知识,相信本章内容对你将有很大的帮助;如果你是Python的中级或高级用户,通过本章内容的阅读,也许多少会有一点查...转载 2019-07-08 16:54:34 · 1564 阅读 · 1 评论 -
第四章Python数值计算工具 ——Numpy
前言尽管在第3章中介绍了有关存储数据的列表对象,但是其无法直接参与数值运算(虽然可以使用加法和乘法,但分别代表列表元素的增加和重复)。本章将介绍另一种非常有用的数据结构,那就是数组,通过数组可以实现各种常见的数学运算,而且基于数组的运算,也是非常高效的。 本章的重点是讲解有关Python数值运算的numpy模块,通过numpy模块的学习,你将掌握如下几方面的内容,进而为后面章节的统计运算和机器...转载 2019-07-09 10:40:05 · 1325 阅读 · 0 评论 -
第五章Python数据处理工具 ——Pandas
前言上一章向读者介绍了有关数值计算的numpy模块,通过numpy模块可以非常方便地调用各种常用的数学和统计函数。本章将介绍强大的数据处理模块Pandas,该模块可以帮助数据分析师轻松地解决数据的预处理问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。通过本章内容的学习,读者将会掌握如下知识点,进而在数据处理过程中做到游刃有余,为后续的数据分析或机器学习做准备:两种重要的...转载 2019-07-18 09:44:14 · 2493 阅读 · 1 评论 -
第六章Python数据可视化
前言文不如字,字不如表,表不如图”,说的就是可视化的重要性。从事与数据相关的工作者经常会作一些总结或展望性的报告,如果报告中密密麻麻都是文字,相信听众或者老板一定会厌烦;如果报告中呈现的是大量的图形化结果,就会受到众人的喜爱,因为图形更加直观、醒目。本章内容的重点就是利用Python绘制常见的统计图形,例如条形图、饼图、直方图、折线图、散点图等,通过这些常用图形的展现,将复杂的数据简单化。这些...转载 2019-07-19 18:50:51 · 4886 阅读 · 13 评论 -
第七章线性回归预测模型
前言线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量)。例如,餐厅根据每天的营业数据(包括菜谱价格、就餐人数、预定人数、特价菜折扣等)预测就餐规模或营业额;网站根据访问的历史数据(包括新用户的注册量、老用户的活跃度、网页内容的更新频率等)预测用户的支付转化率;医院根据患者的病历数据(如体检指标、药物服用情况、平时的饮食习惯等)预测某种疾......转载 2019-07-29 09:22:15 · 37269 阅读 · 16 评论