自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 hadoop伪分布式

core-site.xml:设置Hadoop全局属性,如HDFS的默认FS URI(fs.defaultFS)应指向本地的伪分布式模式,例如 hdfs://localhost:9000;临时文件目录(hadoop.tmp.dir)设置为一个可用的本地路径,如 /usr/local/src/hadoop/tmp。将下载的Hadoop压缩包上传至目标机器,并解压缩至指定目录(如 /opt 或 /usr/local/src)。打开浏览器输入http://localhost:50070。

2024-04-26 17:05:48 676

原创 如何配置永久IP、临时IP以及yum仓库

使用ifconfig命令配置临时IP地址的优点是很容易实现,而且只在当前会话中有效。但是,如果服务器需要经常重启,每次都需要重新配置IP地址,这将变得非常繁琐。临时IP地址配置是指在CentOS服务器上设置一个暂时的IP地址,该地址只在本次启动期间有效,并在重启后失效。永久IP地址配置是指在CentOS服务器上设置一个固定的IP地址,该地址在重启后仍然有效。接着使用vi编辑器打开我们建立的repo文件,在其中输入以下内容。1.选择挂载路径并挂载在/media目录下。2.找到网卡文件并编辑。

2024-03-21 23:56:12 337

原创 大数据相关

1.快速:Spark在内存中的运行速度是Hadoop MapReduce运行速度的100多倍,Spark在磁盘中的运行速度是Hadoop MapReduce运行速度的10多倍。3.通用:Spark框架包含多个紧密集成的组件,包括Spark SQL(即席查询)、Spark Streaming(实时流处理)、Spark MLlib(机器学习库)、Spark GraphX(图计算),并且Spark支持在一个应用中同时使用这些组件。通过水平扩展,可以处理PB级别的数据,满足高性能和高吞吐量的需求。

2024-03-14 22:15:04 229

原创 云上大数据

非结构化数据需要特殊的技术和工具来进行处理和分析。多样性(Variety):大数据来自多种来源,包括结构化数据(如数据库中的数据)、半结构化数据(如 XML、JSON 格式的数据)和非结构化数据(如文本、图像、音频、视频等)。非结构化数据:社交媒体上的用户评论、推文和帖子内容,这些数据通常包含文本、图片、视频等多种形式,难以用传统的表格方式进行组织和存储,因此属于非结构化数据。结构化数据:一个关系型数据库中的客户订单表格,包含订单号、客户姓名、产品名称、数量和价格等字段的数据,是一种典型的结构化数据。

2024-03-08 12:56:09 802

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除