自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 spark练习---统计每个省份的点击最多的三个广告

/依赖rdd4返回的数据((province,adid),num),进行map操作 x:((province,adid),num)// 对top3的kv((province,adid),num) => 转换成 (adid【广告】,num【广告次数】)// 把每个省的广告num次数转成列表,并以num次数大小降序排序,取出每个省的前三的广告。//对相同key的value进行迭代累加计算 ((province,adid),1)// 以(省份,广告)为key,1为value。

2023-05-23 20:35:05 219

原创 Hadoop 入门—hadoop和jdk安装配置

一、通过Xftp把Hadoop和jdk的安装包传到Linux 的指定路径 /opt/software/二、安装Hadoop和jdk ,并指定路径 tar -zxvf hadoop安装包名 -C /opt/module/ tar -zxvf jdk 安装包名 -C /opt/module/三、配置Hadoop和jdk cd /etc/profile.d/ sudo vim my_env.sh#JAVA_HO...

2022-05-07 21:50:13 1858 7

原创 Hadoop入门—环境配置

1.改IP地址:vim /etc/sysconfig/network-scripts/ifcfg-ens332. 测试是否能联网,以ping百度为例 ping www.baidu.com3.改主机名称vim /etc/hostname4.使用户能够使用sudo命令 vim /etc/sudoers 用户名 ALL=(ALL) NOPASSWD:ALL5.在hosts添加以下代码,来配置主机映射...

2022-05-07 21:22:19 804

原创 Hadoop入门

HDFS概述:Hadoop Distributed File System 是一个分布式文件系统HDFS架构概述:Name Node (记录数据位置)储存文件元数据,如文件名,文件目录结构,文件属性,以及文件的块列表和所在的Date NodeDate Node:储存文件数据,以及块数据的校验和Second NameNode:每隔一段时间对元数据备份...

2022-04-21 22:41:09 2171

原创 Hadoop入门

一. 概念 二.环境准备 三.Hadoop生产集群搭建 四. 常见问题的解决方法

2022-04-20 20:05:40 2805

原创 HDFS上传

hadoop fs 命令 or HDFS dfs 命令- move From Local:从本地剪切粘粘到G HDFS- copy From Local 等同于 -put从本地文件系统中拷贝文件到HDFS路径去- appendToFile:追加一个文件到已经存在到文件末尾...

2022-03-26 00:35:08 360

原创 HDFS完文件块大小

HDFS中的文件在物理上是分块存储块的大小可以通过配置参数来规定默认大小在Hadoop2.x/3.x版本中是128M,1.x中是64M

2022-03-24 22:26:19 2440

原创 用Python输出100以内的质数

# 遍历2到100的数,因为[1]可以是其他数的质数for i in range(2,100): # 一样遍历2到2到100的数 for j in range(2, i): # 判断如果模等于0,说明不是质数,结束循环 if i % j ==0: break # 否则输出质数 else: print(i,end=' ')...

2022-03-23 20:35:18 11557

原创 Python练习实例---房贷计算机

a = int(input("请输入商贷贷款金额(万元):"))b = int(input("请输入商贷贷款年限(年):"))A = int(input("请输入公积金贷款金额(万元):"))B = int(input("请输入公积金贷款年限(年):"))if b >5 : d =0.049/12 #d为商贷月利率 e =b* 12 #e为贷款总月数 c =a *d*(1+d)**e/((1+d)**e-1) f =c*e g =(f -a).

2022-03-23 20:33:09 2982

原创 HDFS产生背景和定义

为解决海量数据存储,需要一种系统管理多台机器的文件。HDFS只是分布式文件系统管理的一种HDFS(Hadoop Distributed File System)它是一个文件系统 ,分布式的适用场景: 适合一次写入,多次读出的场景 ...

2022-03-21 22:18:34 278

原创 Linux查找命令find locate grep 管道符

find 【搜索范围】【选项】按文件名查找 路径 【文件名】具体文件名find /home - opt Hello wrold.txt按文件拥有者(用户名)查找 【用户名】find /home - user module按文件大小查找-:小于 +:大于 不写:等于查找等于20M的文件find /home - size ...

2022-03-20 23:04:44 119

原创 Linux 文件目录命令 ln history

ln -s[原文件或目录] [软连接名称]创建软链接rm -rf 软链接名删除软链接history 显示所有的历史指令history 5显示最近使用的5个指令!指令数 例如: !5 会执行 历史指令为5的操作...

2022-03-17 23:28:46 447

原创 Linux文件目录类命令head,tail echo

echo $PATH 查询环境变量环境echo “字符串” 在控制台输出字符串head 文件名 显示文件前十行head -n 5 显示文件前五行tail -f 文件名 实时监控文件变化 实时追加日期tail 文件名 显示文件结尾后十行tail -n 5 文件名 ...

2022-03-16 23:27:45 717

原创 2022年centos下载及Linux安装

目录 一.centos镜像下载 二.Linux的安装配置 1.登入centos官网

2022-03-16 19:53:22 6417 2

原创 2022年最新VMware下载安装教程

目录一. 下载VMware二. 下载镜像 三. 安装配置

2022-03-13 00:09:43 9060

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除