- 博客(4)
- 收藏
- 关注
原创 探寻大数据之未解之谜(四)
root@master src]# scala scala启动成功。将 hadoop-2.7.1 文件夹重命名为 Hadoop。配置 Hadoop 环境变量。
2024-04-29 20:00:48 570
原创 探寻大数据之未解之谜(三)
按如下顺序依次按照 MySQL 数据库的 mysql common、mysql libs、mysql client。系统防火墙,并将防火墙设定为系统开机并不自动启动。目录归属用户和用户组为。用户从本地和远程访问。环境变量并使其生效。
2024-04-09 16:02:14 770
原创 探寻大数据之未解之谜(二)
BOOTPROTO=static # 网卡引导协议(static:静态IP/dhcp:动态IP)DNS1=119.29.29.29 #对应的DNS服务器地址。IPADDR=192.168.10.20 #配置静态ip地址。NETMASK=255.255.255.0 #配置子网掩码。GATEWAY=192.168.10.2 #配置网关。
2024-03-19 17:46:51 308 1
原创 探寻大数据之未解之谜(一)
随着互联网的高速发展,基于数据 密集型应用 的计算框架不断出现,从支持离线处理的mapreduce,到支持在线处理的storm,从迭代式计算框架到 流式处理框架s4,...,在大部分互联网公司中,这几种框架可能都会采用,比如对于搜索引擎公司,可能的技术方法如下:网页建索引采用mapreduce框架,自然语言处理/数据挖掘采用spark,对性能要求到的数据挖掘算法用mpi等。在这类问题中,计算机处理的对象是树结构,元素之间是一种一对多的层次关系,这类数学模型称为树的数据结构。在关闭数据库的情况下进行备份。
2024-03-10 20:10:36 865
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人