Fluid v0.5 还进一步增强了数据集的可观测性能力,具体包括两个部分:
1)与 Prometheus 相结合
该特性能够支持数据集的可用性和性能指标收集,并且通过 Grafana 进行可视化展示。目前已支持 AlluxioRuntime 的实现,使用者可以方便地了解当前可缓存节点、缓存空间、现有缓存比例、远程读、短路读等性能指标。整个配置过程非常简单,达到了对于数据集监控系统“开箱即用"的效果。
具体的使用方法,请参考 Github 上的示例文档。
2)新增数据集缓存命中率指标
该功能可以标识过去 1 分钟内对该数据集的全部访问中有多少访问命中了分布式缓存。该指标一方面能够帮助用户分析他们数据密集型应用中的性能瓶颈,量化查看 Fluid 在整个应用运行的工作流中起到的效果;另一方面能够帮助用户在应用性能提升和缓存资源占用间进行行权衡,做出合理的扩缩容决策。
这一指标被添加在 Fuild v0.5 的 Dataset.Status.CacheStates
的 Dataset CRD 资源状态中,具体来说包括:
-
Cache Hit Ratio:过去一分钟分布式缓存命中的访问百分比。
-
Local Hit Ratio:过去一分钟本地缓存命中的访问百分比。
-
Remote Hit Ratio:过去一分钟远程缓存命中的访问百分比。
注: 对于分布式缓存而言,数据命中有两种不同的缓存命中情况。本地缓存命中指的是访问发起者可直接在同结点访问到缓存数据。远程缓存命中指的是访问发起者需要通过网络访问其他结点上的缓存数据。
在 Fluid v0.5 中,用户可以使用以下命令方便地查看缓存命中率指标:
kubectl get dataset -o wide
NAME … CACHE HIT RATIO AGE
… 86.2% 16m
===============================================================================
自 Fluid 0.4 版本发布以来,我们根据社区用户实际部署反馈的问题和需求,对 Fluid 在多样环境下的部署配置增加了更多支持。
在 Fluid 中,Dataset 资源对象中所定义的远程文件是可被调度的,这意味着你能够像管理 Pod 一样管理远程文件缓存到 Kubernetes 集群上的位置。执行计算的 Pod 可以通过 Fuse 客户端访问数据文件。在先前版本的 Fluid 中,Fuse 客户端总是会调度到缓存所在的节点上,但是用户不能自由控制 Fuse 的调度。
在 Fluid v0.5 中,我们为 Fuse 新增了 global 部署模式。在该模式下,Fuse 默认会全局部署到所有节点上。用户也可以通过指定 Fuse 的 nodeSelector 来影响 Fuse 的调度结果。同时,缓存会优先调度部署在执行计算 Pod 数量较多的节点上。
具体使用非常简单,可以参考 Github 上的示例文档。
很多社区用户使用分布式缓存系统 Alluxio 作为 Fluid 数据集的缓存引擎。在数据集持久化存储于 HDFS 文件系统的情况下,要使得 Alluxio 能够正常访问底层 HDFS,Alluxio 集群需要提前获取该 HDFS 的各类配置信息。
在 Fluid v0.5 中,我们使用 Kubernetes 的原生资源为上述场景提供支持。用户首先需要将 HDFS 的相关配置文件(e.g. hdfs-site.xml
和 core-site.xml
)以 ConfigMap
方式创建到 Kubernetes 环境中,接着在创建的 AlluxioRuntime
资源对象中引用上述创建的 ConfigMap
从而实现上述功能。
AlluxioRuntime
资源对象的一个示例如下所示:
apiVersion: data.fluid.io/v1alpha1
kind: AlluxioRuntime
metadata:
name: my-hdfs
spec:
…
hadoopConfig:
…
至此,创建出的 Alluxio 集群将能够正常地访问 HDFS 集群中的数据。更多内容可参考 Github 上的示例文档。
===============================================================================
Fluid 默认使用的分布式缓存 Runtime 是 AlluxioRuntime,为了支持不同环境用户对缓存系统的需求,在之前的版本中 Fluid 已经将分布式缓存 Runtime 接入框架做成了可插拔的架构。在 Fluid v0.5 中,来自阿里云的社区贡献者基于该框架开发了 JindoRuntime,新增了一种支撑 Fluid Dataset 数据管理和缓存的执行引擎实现。用户可以在 Fluid 中通过 JindoRuntime 使用 JindoFS 的 Cache 模式进行远端文件的访问和缓存。在 Fluid 上使用和部署 JindoRuntime 流程简单、兼容原生 K8s 环境、开箱即用。
=======================================================================
在 Fluid v0.5 中,我们对 Fluid 的功能特性与用户体验都进行了丰富和增强。
首先,Fluid v0.5 进一步增加了数据集的功能操作:
-
提供数据集在线弹性扩缩容能力,实现更灵活、更精细的集群资源分配控制。
-
新增 DataBackup CRD,实现了数据集文件元数据等信息的备份与恢复,帮助完成数据集缓存系统的快速重启。
-
新增缓存命中率指标,帮助用户更好量化分析 Fluid 提供的加速效果。
其次,Fluid 支持更多环境模式和配置,满足更多真实场景的部署需求。
最后,Fluid 新增了基于 JindoFS 的分布式缓存 Runtime —— JindoRuntime,为用户在多样化部署环境中提供不同的缓存引擎选择。
我们会继续广泛关注和采纳社区建议,推动 Fluid 项目的长期发展,期待听到大家更多的反馈。如果您有任何疑问或建议,欢迎加入 Fluid 用户群参与交流或在 Github 上与我们讨论:
小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数初中级Java工程师,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新Java开发全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注Java)
总结
对于面试,一定要有良好的心态,这位小伙伴面试美团的时候没有被前面阿里的面试影响到,发挥也很正常,也就能顺利拿下美团的offer。
小编还整理了大厂java程序员面试涉及到的绝大部分面试题及答案,希望能帮助到大家,
最后感谢大家的支持,希望小编整理的资料能够帮助到大家!也祝愿大家都能够升职加薪!
候没有被前面阿里的面试影响到,发挥也很正常,也就能顺利拿下美团的offer。
小编还整理了大厂java程序员面试涉及到的绝大部分面试题及答案,希望能帮助到大家,
[外链图片转存中…(img-esRm2yR3-1711392632375)]
[外链图片转存中…(img-eHFuvWe4-1711392632375)]
最后感谢大家的支持,希望小编整理的资料能够帮助到大家!也祝愿大家都能够升职加薪!