1. 什么是大数据?
对大量的数据集文件处理的过程,称之为大数据(TB级以上)
大量数据集:b—k---M—G---T—PB—EB—ZB 换算单位:1024
2. 为什么是大数据?
通过对海量数据进行统计分析,从而在这些分析和统计过程中找出内在规律,从而伪国家和企业创造价值
3. 大数据特点?
4v特征
1.Volume(大量) 数据集非常大  TB级以上||如果数据增长在每天/GB级
2.Variety(多样)  数据格式多样 非格式化:音频,视频 半结构:json,mongdb
3.Velocity(快速)  数据处理一定快
4.Value(价值)
4. 大数据核心处理的数据类型:文本类型
5. 大数据的来源
1.ngxin的用户访问日志 系统运行日志  系统运行过程中数据库中数据
2.爬虫
3.行业数据
6. 大数据今天面临的问题?
1.大数据存储问题
2.大数据的计算问题
Hadoop-大数据引言
最新推荐文章于 2024-10-11 21:54:44 发布
          
          
       
          
       
      
本文介绍了大数据的概念,探讨了其处理过程及重要性,并分析了大数据的特点(4V特性)、主要处理的数据类型、来源以及当前面临的挑战。
          
                  
                  
                  
                  
                            
                            
      
          
                
                
                
                
              
                
                
                
                
                
              
                
                
                    
              
            
                  
					4910
					
被折叠的  条评论
		 为什么被折叠?
		 
		 
		
    
  
    
  
					
					
					


            