![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据面试题
大数据面试题
我是方小磊
这个作者很懒,什么都没留下…
展开
-
解释部署大数据解决方案应遵循的步骤
步骤图:1)数据摄取部署大数据解决方案的第一步是数据摄取,即从各种来源提取数据。数据源可以是Salesforce之类的CRM,SAP之类的企业资源计划系统,MySQL之类的RDBMS或任何其他日志文件,文档,社交媒体源等。可以通过批处理作业或实时流来摄取数据。然后将提取的数据存储在HDFS中。2)数据存储提取数据后,下一步是存储提取的数据。数据可以存储在HDFS或NoSQL数据库(即HBase)中。HDFS存储适用于顺序访问,而HBase适合随机读取/写入访问。3)数据处理部署大数据解决方案的转载 2021-05-17 19:32:55 · 369 阅读 · 0 评论 -
大数据的5个V是什么
大数据的5个V是什么?答:卷(Volume)-卷表示卷,即以高速率增长的数据量,即以PB为单位的数据量速度(Velocity)–速度是数据增长的速度。社交媒体在增长数据的速度中起着重要作用。多样性(Variety)–多样性是指不同的数据类型,即各种数据格式,例如文本,音频,视频等。准确性(Veracity)–准确性是指可用数据的不确定性。由于大量数据带来不完整和不一致,因此会出现准确性。价值(Value)–价值是指将数据转化为价值。通过将访问的大数据转化为价值,企业可以产生收入注意: 这是转载 2021-05-17 19:21:59 · 6239 阅读 · 0 评论