自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 计算机网络

1.21世纪的一些重要特征就是数字化、网络化和信息化,它是一个以网络为核心的信息时代 2.三大类大家很熟悉的网络即电信网络、有线电视网络和计算机网络。3.Internet的中文译名并不统一。现有的Internet译名有两种:(1)因特网,这个译名是全国科学技术名词审定委员会推荐的。虽然因特网这个译名较为准确,但却长期未得到推广。本书的前几版都采用因特网这个译名。(2)互联网,这是目前流行最广的、事实上的标准译名。现在我国的各种报刊杂志、政府文件以及电视节目中都毫无例外地使用这个译名。Internet是由数量

2020-12-16 14:25:28 213

原创 大数据技术复习

大数据4“V”: 数据量大(Volume) 数据类型繁多(Variety) 处理速度快(Velocity) 价值密度低(Value) 大数据对思维方式的影响:全样而非抽样、效率而非精确、相关而非因果。 大数据的基本处理流程:数据采集、存储、分析和结果呈现。 数据采集与预处理: 利用ETL工具将分布的、异构数据源中的数据,如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;也可以利用日志采集工具(如Flume、Kafka等)把实

2020-12-16 09:15:45 452 1

原创 大数据第一章复习

大数据4“V”: 数据量大(Volume) 数据类型繁多(Variety) 处理速度快(Velocity) 价值密度低(Value) 大数据对思维方式的影响:全样而非抽样、效率而非精确、相关而非因果。 大数据的基本处理流程:数据采集、存储、分析和结果呈现。 数据采集与预处理: 利用ETL工具将分布的、异构数据源中的数据,如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;也可以利用日志采集工具(如Flume、Kafka等)把实

2020-12-15 15:16:35 234

原创 数据预处理

数据预处理 数据预处理(datapreprocessing)是指在主要的处理以前对数据进行的一些处理。如对大部分地球物理面积性观测数据在进行转换或增强处理之前,首先将不规则分布的测网经过插值转换为规则网的处理,以利于计算机的运算。另外,对于一些剖面测量数据,如地震资料预处理有垂直叠加、重排、加道头、编辑、重新取样、多路编辑等。 基本介绍 现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘的质量产生了数据预处理技术。  数据预处理有多种方法: 数据清理,

2020-12-15 14:45:15 143

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除