
大数据
文章平均质量分 78
chuixue24
这个作者很懒,什么都没留下…
展开
-
腾讯欧拉t-Metric指标中台实践
导读腾讯欧拉平台是腾讯 PCG(平台与内容事业群)推出的数据治理平台化解决方案,目前已在腾讯内部广泛使用。腾讯欧拉 t-Metric 指标中台基于 DataOps 理念,结合 Headless BI 实践,提供一站式指标建、管、查、用能力,以提升指标生产和治理水平,沉淀企业安全可靠、使用便捷、质量可信的数据资产。t-Metric 指标中台主要为用户提供配置驱动的指标生产方式、统一查询服务、以及完善的指标生态等核心能力。本次分享题目为腾讯欧拉 t-Metric 指标中台 Headless BI 实践,具体转载 2024-06-19 18:46:59 · 628 阅读 · 0 评论 -
基于PostgreSQL的时序数据库TimescaleDB的基本用法和概念
TimescaleDB是一个在PostgreSQL之上构建的时序数据库,它利用了关系型数据库的成熟性和灵活性,并针对时序数据进行了优化。TimescaleDB通过使用分区表(hypertable)和连续聚集表(continuous aggregate)来处理时序数据,使得数据的存储和查询更加高效。转载 2024-04-18 14:14:17 · 5991 阅读 · 0 评论 -
InfluxDB 的存储机制解析
尽管InfluxDB自发布以来历时三年多,其存储引擎的技术架构已经做过几次重大的改动, 以下将简要介绍一下InfluxDB的存储引擎演进的过程。以上就是对InfluxDB的存储机制的粗浅解析,由于目前所见的只有单机版的InfluxDB,所以尚不知道集群版的InfluxDB在存储方面有哪些不同。但是,即便是这单机版的存储机制,也对我们设计时序数据库有着重要的参考意义。转载 2024-04-18 12:00:03 · 714 阅读 · 0 评论 -
Hive 与mysql区别
视图是一种使用查询语句定义的虚拟表,是数据的一种逻辑结构,创建视图时不会把视图存储到磁盘上,定义视图的查询语句只有在执行视图的语句时才会被执行。不要把 Hive 想的多么神秘,你可以用简单的load方式将数据加载到创建的表里,也可以直接用hadoop指令将数据放入到指定目录,这两种方式都可以直接让你通过SQL查询到数据。数据分布不平衡,某些地方特别多,某些地方又特别少,导致的在处理数据的时候,有些很快就处理完了,而有些又迟迟未能处理完,导致整体任务最终迟迟无法完成,这种现象就是数据倾斜。转载 2024-04-01 14:25:47 · 2973 阅读 · 0 评论 -
window10上配置Hadoop
Shell/Hadoop fs/HDFS/dfs的一些相关操作,相当于是在集群内部,跟集群的一些客户端打交道在这里插入图片描述本文目标:希望在Windows环境对远程的集群进行一个客户端访问,于是现在就在Windows环境上写代码,写HDFS客户端代码,远程连接上集群,对它们进行增删改查相关操作。在这里插入图片描述。转载 2024-02-18 11:29:52 · 368 阅读 · 1 评论 -
java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/server/timelineservice/collector/TimelineColl
win10,启动hadoop报错:java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/server/timelineservice/collector/TimelineCollectorManager解决办法:将D:\work\hadoop\hadoop-3.1.4\share\hadoop\yarn\timelineservice\hadoop-yarn-server-timelineservice-3.1.4.jar复制到D:\wor原创 2021-03-01 16:41:31 · 1792 阅读 · 3 评论 -
中国民生银行 HBase 读写设计与实践
背景介绍本项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询。原实现基于 Oracle 提供存储查询服务,随着数据量的不断增加,在写入和读取过程中面临性能问题,且历史数据仅供业务查询参考,并不影响实际流程,从系统结构上来说,放在业务链条上游比较重。本项目将其置于下游数据处理 Hadoop 分布式平台来实现此需求。下面列...转载 2020-04-10 17:33:17 · 2086 阅读 · 0 评论