![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 56
天晴兮
这个作者很懒,什么都没留下…
展开
-
大数据分析的工作流程以及各流程常用工具
大数据分析的工作流程以及各流程常用工具1. 数据收集与导入2. 数据质量控制3. 数据管理与存储4. 数据分析与可视化5. 数据建模与模型管理6.常用的数据分析方法 1. 数据收集与导入 在大数据时代,“数据”不只是表格数据,更多的是非结构化数据(图片,声音,视频)。随着需要收集的数据量的增大,数据的实时收集、实时处理变得不是那么容易。 Spark和Kafka等软件就是针对以上问题开发的目前最流行的开源数据接入(数据接入, 数据处理和数据仓库技术)工具。他们可以对海量信息的实时收集,处理和存储。 2. 数据原创 2021-06-17 21:16:41 · 1192 阅读 · 0 评论 -
python的分离式动态线性表(追求最极致的通俗易懂,用人话说计算机知识,杜绝无脑复制粘贴)
前言:本文阐述个人观点,如有不同见解欢迎评论区讨论~ 线性表:在内存上连续存储数据的一种数据存储方式,或者说是一种数据结构。 动态:当线性表一开始分配的空间不够时,找一块更大的地方存数据(比如一开始只分配了10个空间,你一直加数据加数据,到第10个的时候,空间满了,可是还想继续加咋办?再找一块更大的数据空间,先把已有的10个数据全部搬过去,之后再继续添加。对,就是这么干的,虽然搬数据会消耗时间) 分离式 为什么说python的list是分离式的呢? 为什么python的list要做成分离式的呢?有什么好处么原创 2021-06-17 17:56:35 · 191 阅读 · 0 评论