记得第一次接触“大数据”的概念,是在2017年的时候,记得当时大数据好像第一次火遍全国,甚至我所在的边疆省份的二线城市也燃起了大数据的星星之火;那时正好有个机会,公司和大学合作,要开展大数据的免费公开实战课,于是自学了一个月的大数据(离线部分),并且在接下来的三个月里,给大概几百个孩子讲了关于大数据的内容。
过了那个阶段之后,在企业中做售前和部分解决方案的工作,大数据的学习就暂时告一段落了。直到最近,发现自己到了瓶颈、没法突破,才意识到技术上已经欠缺了许多;于是有了到目前为止近一个月的技术恶补。
闲话就到这,接下来本人更新的所有博客、文章内容,应该都会和java、大数据、机器学习、深度学习、项目管理等等方面有关系吧。
书归正传,开始第一篇大数据文章:
一、什么是大数据:
大数据是指无法在一定时间范围内用常规软件、工具 进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
(通俗可以解释成:量很大的数据,就是大数据(PB级别:人类所有的印刷材料的数据量大概是200PB、全人类中国说过的话大概5EB))
二、大数据的特点4V:
1、大量(Volume): 到目前,人类所有的印刷材料的数据量大概是2