一、前言
您好,欢迎来到 python数据分析 学习课堂,我是根华,从今天开始我们就来学习python数据分析这门课程。
首先,我们先来简单的介绍一下这门课程,整理一下背景知识,好对这门学科有一个大概的认识,方便接下来的学习。
二、初识大数据
大数据是近几年来都一直很火的一个名词,似乎是伴随着"互联网"的逐渐发展所出现的一个新名词。
那什么是大数据呢?简单来说,大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,同时也是利用我们日常生活中产生的数据来对相应的事件进行分析总结预测,进而从中得到有价值的信息。
所以,在我看来,大数据行业生产流程从数据的生命周期的传导和演变上可以分为这样几个部分:数据收集、数据存储、数据建模、数据分析、数据变现。
从上面的几个部分来看,其中数据分析无疑是重中之重,因为在大数据的背景下,一天产生的各种数据多达几十T,甚至更多,那么如何从如此庞大的数据当中找出那些具有价值的数据,让个人或者企业从中获利,这个时候,我们需要利用相关的技术来对这些数据进行合理的分析,这便是我们所要面临与解决的问题。
三、大数据分析
大数据分析注重的是数据指标的建立,数据的统计,数据之间的联系,数据的深度和机器学习,并利用探索性数据分析的方式得到更多的规律,知识,或者对未来事物预测和预判的手段。
四、利用python进行数据分析
在数据分析方面,我们大多数都很容易爱上Python这门语言。自从1991年诞生以来,Python现在已经成为最受欢迎的的动态编程语言之一。它具有简单、易学、免费开源等优点,并且最大的优点是由于有大量的第三方库供使用者使用,从而很大程度上提高了编程效率,节约了很多不必要的时间。
而我们在做数据分析工作的时候,主要用到了里面的一些第三方库,比如:NumPy、pandas、matplotlib、SciPy。
五、结语
针对python数据分析的背景知识就介绍的差不多,有了以上的背景知识做铺垫,相信在接下来的学习中将会事倍功半,那么接下来我们的课程主要就是围绕以上的几个python库结合理论与实践来进行讲解练习,从而达到能熟练运用的各各库来解决实际中问题。
好了,今天内容就到此结束,感谢大家的学习,我们下次再见。
六、参考文献
①《大数据时代》维克托.迈尔.舍恩伯格
②《白话大数据与机器学习》高扬 卫峰等