大数据
文章平均质量分 92
lyx52Hertz
这个作者很懒,什么都没留下…
展开
-
Hadoop集群基础搭建
HDFS的定义:HDFS是一种允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多个用户分享文件和存储空间。HDFS的适用场景:适合一次写入,多次读出的场景,且不支持文件的修改。安装完成后/opt/module/目录下出现 hadoop-3.3.6文件。文件/root/.ssh/authorized_keys是个。mv命令用法:mv /要改名的文件路径 /改名后的路径。存放路径为:/hadoop的路径/etc/hadoop/:mv /要移动的文件路径 /目标目录的路径。原创 2024-10-13 20:46:53 · 1048 阅读 · 1 评论 -
大数据—爬虫基础
使用and、or、not等逻辑运算符选择节点,例如://book[price原创 2024-05-14 09:45:18 · 2115 阅读 · 0 评论 -
大数据—数据可视化—Pyecharts配置项
基础图表。原创 2024-03-14 21:29:17 · 3126 阅读 · 0 评论 -
大数据—数据可视化—matplotlib
10) :设置标记点。将xlim()和 ylim()的参数反转,坐标轴反转。用x,y 表示标题在x轴,y轴的位置。其他的和垂直方向的堆叠条形图的绘制类似。在绘制水平方向的堆叠条形图时,需要将参数。=3) : 设置标记点。='grey') :设置标记点。一个带有圆角和内部凹陷的复杂框。图例展示为几列,默认展示为1列。ncols参数,传入数字类型。='white') :设置。先框选出要画图例的区域,配合。参数指定文本框的样式,使用。正方形框,带有尖角。原创 2024-04-26 19:50:47 · 1182 阅读 · 1 评论 -
大数据—数据可视化—Pyecharts基础图表
学习作图前先要先学习画图配置项条形图 Bar ( )堆叠柱状图折线图 Line()阶梯图连接空数据(折线图)面积图饼图 Pie()环形图嵌套饼图玫瑰图散点图动态涟漪散点图雷达图箱型图词云图 WordCloud()漏斗图 Funnel水球图地图。原创 2024-03-19 11:26:00 · 994 阅读 · 0 评论 -
大数据—MapReduce概念
Mapper函数是对输入数据进行处理的函数。它接收输入的数据记录,将其转化为(Key,Value)对,并输出到Reducer函数进行处理。你可以根据需求自定义Mapper函数。原创 2024-04-10 10:05:25 · 2782 阅读 · 1 评论 -
大数据—pandas基础教程
pandas数据结构Series结构如下Series 类似于一维数组的对象,可以保存任何类型的数据,由一组数据和相关的索引两部分组成创建Series对象获取数据和DataFrame创建DataFrame对象DataFrame使用读取数据有时候会报错是因为编码格式的问题,主要的编码格式有。在导入的时候加上encoding=“编码格式”如:pd.read_csv(r"xxx",encoding=“gbk”)数据查看索引操作基础索引索引和索引索引排序嵌套列表创造多重索引导入库。原创 2024-04-03 11:40:40 · 1054 阅读 · 1 评论 -
大数据—HDFS常用命令
HDFS的定义:HDFS是一种允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多个用户分享文件和存储空间。HDFS只是分布式文件管理系统中的一种。HDFS的适用场景:适合一次写入,多次读出的场景,且不支持文件的修改。原创 2024-03-20 22:00:13 · 1239 阅读 · 2 评论