自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 达之云牵手杭州数梦联合启动智慧矿业大数据服务项目

达之云公司通过Redash中文商业版BI产品,以数梦工厂的数据中台为数据驱动,将为客户搭建10个符合煤矿需求的可视化大屏,利用大数据治理手段、数据标准、数据建模、指标建立等手段实现前端效果展现。将煤矿生产、安全、监控、运检、调度、运营等业务板块进行指标建立,通过BI功能展现到前端,达到综合监测、主动感知、提前预防、主动参谋的目的。为煤矿提供跨专业关联分析和数据可视化应用,将煤矿生产、安全、监控、运检、调度、运营实时数据、分析数据、成果数据上屏,达到综合监测、主动感知、提前预防、主动参谋的目的。

2023-05-15 17:18:29 101

原创 基于dbt的机器学习:流畅的过程衔接

DBT 继承了我们在 SQL 上的工作,在数据工程师、数据分析工程师和任何数据角色之间构建了一个优雅、通用的、操作友好的环境。工具和工作流的统一在数据组织内为不同团队之间创建了互操作性。就像在接力赛中一样,在过程的各个阶段都有明确的交接点和明确的所有权。但截止目前,还有一个环节仍然痛苦且不确定:机器学习(ML)工程师和数据分析工程师之间的衔接。根据我的经验,ML工程和数据分析工程之间的初始协作工作流程开始时很强大,但最终在维护阶段变得混乱。这最终导致项目变得无法使用和被遗忘。

2023-04-07 17:48:05 327 1

原创 发挥现代数据栈MDS的更大价值

从原始数据到有价值的、可操作的见解的过程是漫长的,不适合胆小的人。旅程的每一步都需要时间和精力,而且往往需要不同的工具。例如,第一步 - 数据收集 - 已经是一场艰巨的艰苦战斗,因为公司的数据分散在各种源系统和文件中。将碎片数据集成到集中式数据仓库依赖于 ELT 或 ETL 过程,为此您可能需要多个提供程序来连接所有源。以下步骤 - 存储,转换,可视化和分析 - 都涉及将数据重新定位或转换为不同的格式和结构。不用说,这不是一件容易的事。

2023-04-06 17:41:23 321

原创 通过 DVT 和 dbt 测试监控Airbyte数据管道

首先,在提取加载 (EL) 步骤中,在加载作业完成后,根据目标中的数据验证源中的数据质量。开源替代方案包括普罗米修斯、洛基、远大期望、数据验证工具 (DVT)、dbt 测试、Datafold 的数据差异等......需要注意的重要一点是,您可能需要组合其中两个或多个工具来实现您的目标。下面的代码片段实现了从 Google Cloud Function 运行的通知/提醒系统,并在源表中的行/列数与上述数据验证示例中的目标表不匹配时将通知/警报推送到 Slack 渠道。这种类型的监视发生在管道的转换阶段之后。

2023-04-04 17:59:08 405

原创 你想知道的关于现代数据栈MDS的所有内容

如上所述,现代数据堆栈的倡导者包括dbt,Fivetran,a16z,其他数据软件公司和许多风险投资。他们都想改变的是公司准备数据进行分析的方式:从传统的ETL(提取,转换,加载)到ELT(提取,加载,转换)。相反,ELT 的意思是,在将数据加载到云数据仓库之前,只需要数据提取和数据加载。现在回到本文的主题,这种以数据仓库为中心的构建堆栈的方式是现代数据堆栈所倡导的方式:数据仓库功能的广泛使用。现代数据堆栈的目标是大大简化用户管理数据的难度,让用户更关心数据本身,而不是软件。因此,起点是不同的。

2023-04-03 17:38:32 525

原创 ETL 与 ELT的关键区别

ETL 和 ELT 之间的主要区别在于转换的时间和位置:它是在数据加载到数据仓库之前还是在存储之后发生。实施管道所需的技术技能,支持每个选项所需的产品数量和复杂性,技能团队雇用的数据团队本身的结构,以及数据堆栈的准备性和灵活性。在我们深入了解这些差异的细节之前,让我们清楚地定义什么是 ETL 和 ELT,以及为什么 ELT 已成为分析行业的最新现象。什么是 ETL?ETL或“提取、转换、加载”是首先从数据源中提取数据,对其进行转换,然后将其加载到目标数据仓库的过程。

2023-03-31 17:47:25 1346

原创 DBT构建和部署机器学习模型预测订单退货

机器学习 (ML) 在数据驱动的决策中越来越重要,因此使用现代工具和技术来简化机器学习工作流程非常重要。这就是 dbt 和 fal 可以发挥作用的地方 - 它们一起使以可扩展和可重现的方式管理和部署机器学习模型变得容易。在这篇博文中,我们将引导您了解如何使用 fal 和 dbt 来训练和存储逻辑回归 ML 模型,对新数据进行预测,并将这些预测存储在 dbt 模型中。在这篇文章结束时,您将具备将这些工具应用于您自己的 ML 项目的技能和知识。

2023-03-30 18:02:40 171

原创 数据工程:ELT 工作流中的 6 个步骤

因此,一个好的数据转换过程既严格又灵活 - 该过程允许足够的护栏,使分析工作有价值和有条理,有足够的空间来有趣、具有挑战性和针对您的业务进行定制。在实际的转换步骤中,已加载到数据仓库中的原始数据,您熟悉该数据的结构,并且您有一个关于如何处理它的大致计划 - 它终于准备好开始您的建模过程了!如果您对原始数据的准确性和完整性有很高的信心,那么与质疑数据的完整性相比,此步骤可能会变得不那么费力(如果您是数据从业者,这可能是您的自然倾向😉)。在提取过程中,从与您的业务相关的多个数据源中提取数据。

2023-03-29 17:49:28 228

原创 自助式分析是数据组织的一种状态

例如,在我认识的一家消费者软件公司中,该公司报告结构中的许多人都精通SQL,因此他们能够通过面向SQL的BI工具,精心策划的数据仓库和一两个可视化工具的组合来解决自助服务问题。然后你的公司成长起来,创建了向不同领导者报告的部门,每个部门都雇佣了自己的分析师,现在你在公司的各个部门都有一群分析师,都在编写查询或调整Excel电子表格,只是试图跟上你的公司向他们提出的业务要求。“我们非常高兴,”他告诉我们,“产品团队和营销团队都有自己的仪表板,一旦我们设置了所有内容,我们从这两个团队收到的请求数量就会下降。

2023-03-27 17:48:57 497

原创 现代数据栈MDS应用落地介绍—MozartData数据驱动从未如此简单

莫扎特数据的现代数据堆栈可以由那些几乎没有技术专长的人建立,并且成本只是其他选项的一小部分,这要归功于Snowflake和Fivetran的合作伙伴折扣。MozartData提供了一个开箱即用的现代数据平台,该平台具有内置的技术集成和工具,可实现可观测性、可靠性和编目,因此组织中的任何人都可以查找和使用完整、准确和最新的信息。将数据可观测性作为数据平台服务,利益干系人可以查看整个数据管道中的数据沿袭,包括源表、这些表的数据转换、生成的表、版本历史记录以及依赖项的快速概览视图。其中最重要的是数据可观测性。

2023-03-24 17:35:45 159

原创 现代数据栈MDS应用落地介绍—Vero营销自动化平台

如果 你有一个像Dribbble这样的数据仓库设置,这意味着 支付两次费用以存储相同的数据:一次在您自己的数据中 仓库,并再次在您的电子邮件服务提供商的云中。这是运球的场景 发现自己在。现代数据栈MDS的出现使得中小企业低成本获得大数据处理能力成为可能,技术的进步使得各种基于MDS的大数据应用如雨后春笋般涌现,不同于国内的数据中台更多强调数据处理技术,MDS注重落地和最后一公里的大数据应用。在原始成本之上 重复数据存储,运行中涉及的维护 数据管道的拼凑使所有内容保持同步,增加了 巨大的维护成本。

2023-03-23 17:55:33 263

原创 现代数据栈MDS应用落地介绍—ActionIQ智能营销系统

现代数据栈MDS的出现使得中小企业低成本获得大数据处理能力成为可能,技术的进步使得各种基于MDS的大数据应用如雨后春笋般涌现,不同于国内的数据中台概念,MDS注重落地和最后一公里的大数据应用。随着客户隐私和数据保护的增加,作为营销人员和组织,我们如何使我们的业务面向未来,并考虑正确的技术堆栈,以帮助我们保护面临风险的收入,更重要的是,开始考虑如何创造更无缝的客户体验来推动增长?在遵守隐私法规的情况下,跨您选择的第一、第二和第三方来源管理和解析匿名和已知客户的身份。使用机器学习来识别和定义新的高价值机会。

2023-03-21 17:52:56 221

原创 现代数据栈MDS应用落地介绍—Clearbit营销数据激活平台

现代数据栈MDS的出现使得中小企业低成本获得大数据处理能力成为可能,技术的进步使得各种基于MDS的大数据应用如雨后春笋般涌现,最后一公里的大数据应用在企业的普及,反过来也促使MDS技术平台快速发展。额外的表单字段通常意味着更少的合格潜在客户。获取公司关心的每家公司和联系人的更全面背景信息,以推动大规模洞察、转化和制胜。一致的上下文可让您实时评分和路由潜在客户,以便您可以告别不适合、错误路由的潜在客户和手动排序。使用您的 CRM 数据、网站数据和 100+ 公司、技术和员工属性,通过精确的受众推动更多管道。

2023-03-20 17:54:33 169

原创 现代数据栈MDS应用落地介绍—DataChannel数字营销分析

DataChannel公司推出的数字化营销和分析产品,让营销团队能够在需要时快速访问来自所有广告平台和营销自动化工具的新数据。通过与所有关键营销平台的集成,获取数据变得轻而易举。随时随地构建报告和仪表板。使用高质量数据超个性化您的广告投放,跨营销平台运行超个性化的营销活动。在一个统一平台管理您的细分和受众。现代数据栈MDS的出现使得中小企业低成本获得大数据处理能力成为可能,技术的进步使得各种基于MDS的大数据应用如雨后春笋般涌现,最后一公里的大数据应用在企业的普及,反过来也促使MDS技术平台快速发展。

2023-03-17 17:55:39 48

原创 现代数据栈MDS的6个趋势

他说,在IT运营管理领域,这涉及分析数据,包括指标,事件,日志,拓扑,事件和更改,并且需要开放的平台,并且可以集成来自无数工具和技术的数据,并补充说,堆栈还需要支持混合客户来自本地数据中心基础设施和应用程序以及多个云资产的数据。“人们,普通商业用户,使用AI / ML做非凡事情的方式,将改变未来企业的运营方式,”他说,并补充说谷歌正在寻找进一步民主化人工智能和机器学习的方法,以便那些没有数据背景的人可以通过简单的电子表格访问它。我们在谷歌有备份,在微软有其他备份,这种互连正在变得正常,“齐马说。

2023-03-16 17:50:24 183

原创 现代数据栈MDS兴起

数据仓库曾经是数据团队的巨大瓶颈。这就是您的数据来源:它可以是您的生产数据库(例如PostgreSQL),Web服务器的日志,或者第三方应用程序,如Stripe,Zendesk或您正在使用的任何其他产品。例如,在传统的数据堆栈中,想要访问过产品某个区域的客户列表的客户经理需要友好的工程师或分析师的帮助来为他们“提取”数据。通常,这是作为技术和服务的列表共享的,但是给定堆栈背后的工作和理论比简单格式所允许的要多方面得多。在成熟的数据堆栈中,它是通常是数据仓库,但可能只是一个数据库的只读副本在早期阶段的公司。

2023-03-15 17:47:59 330

原创 DBT是什么

仅使用 SQL 语句或 Python 数据帧编写业务逻辑,返回所需的数据集,dbt 负责select物化.构建可重用或模块化的数据模型,这些数据模型可以在后续工作中引用,而不是从每次分析的原始数据开始。DBT 针对您的数据平台编译并运行您的分析代码,使您和您的团队能够在指标、见解和业务定义的单一事实来源上进行协作。作为 dbt 用户,您的主要关注点将是编写反映核心业务逻辑的模型(即选择查询)——无需编写样板代码来创建表和视图,也无需定义模型的执行顺序。通常,数据源中的记录是可变的,因为它们会随时间而变化。

2023-03-14 17:47:51 243

原创 现代数据堆栈MDS有什么现代之处

设计一个好的MDS,让你的员工做他们的工作,回报将是无价的。为了保持竞争优势,组织需要能够在正确的时间采取行动的数据,并且足够灵活地适应变化。随着网络安全威胁、负责任的 AI 以及数据法规的增加,在没有考虑数据治理的情况下构建的系统是每个 CIO 的噩梦。需要注意的重要一点是,尽管没有任何奶油,但最终结果是你仍然有一个可以吃的蛋糕。例如,Metabase是一个可视化工具,不需要SQL知识来构建,也不需要BI专家的帮助来使用。这种方法的问题在于,MDS 现在是围绕工具构建的,而不是为用户构建的。

2023-03-13 17:46:14 77

原创 Metabase和Superset 对比分析

根据可视化功能的数量和类型,Superset 是创建丰富数据可视化效果的比Metabase更好的选择。此外,Metabase通过部署 Java jar 文件提供安装,该文件必须使用简单的命令运行,以在用户的本地基础结构上设置Metabase平台。简单的界面: Metabase以其简单的用户界面而闻名,该界面允许用户轻松创建仪表板和图表,并使用SQL编辑器和问题创建器为即席查询提供答案。社区版本是开源且免费的。高质量的文档: Metabase为用户提供了广泛的高质量文档,以便轻松部署和使用该平台。

2023-03-09 17:56:51 316

原创 Metabase和Looker对比分析

Google以文档,教程视频和Google社区支持的形式为Looker用户提供了广泛的支持。Looker是Google提供交互式仪表板和实时报告的数据可视化工具,以其在项目管理任务(如构建项目报告和预算预测)中的服务而闻名。可视化: 除了用于创建复杂仪表板的 SQL 查询外,Metabase 还为用户提供了问题创建者,只需单击几下即可从数据创建基本可视化,而无需编程。向下钻取功能: Looker 和Metabase都允许用户向下钻取他们的数据,以分层的形式组织和呈现数据,以便于数据访问和理解。

2023-03-08 17:33:19 147

原创 Metabase和FineBI比较

Metabase是一款优秀的自助式数据分析和可视化工具,具有易于安装和使用、丰富的可视化方式、多数据源支持、高度的扩展性和定制性以及轻量级和响应迅速等诸多优势。通过Metabase,用户可以轻松地分析和可视化数据,从中挖掘出更多有价值的信息,并帮助他们做出更明智的决策。与FineBI相比,Metabase的架构更加灵活,用户可以通过编写自定义的插件和API来扩展和定制其功能。同时,Metabase还提供了丰富的主题和样式,可以让用户根据自己的品牌和需求自定义报表和图表的外观。

2023-03-07 17:34:29 178

原创 Metabase和Tableau、QlikView差异

Metabase 是一个强大而且成本效益高的商业智能工具,具有易于使用、灵活、支持多个数据源、自定义报告和仪表盘、多级问题、自定义问题、共享数据集和仪表盘、数据驱动的提醒和电子邮件通知等功能。然而,对于处理更大量级和更复杂的数据集以及进行更准确的数据预测和分析,Tableau 和 QlikView 可能更加适合。除了基本的数据查询和可视化功能,Metabase 还提供了一些高级功能,例如多级问题、自定义问题、共享数据集和仪表盘、数据驱动的提醒和电子邮件通知等。

2023-03-06 18:08:08 60

原创 配置Airbyte资源限制

如果您连接(管道)的url是。如果 job 容器的内存不足,只需登录到 Airbyte Web 中的 job 页面,检查日志查看 job 的资源配置是否符合预期,如果确实给的资源不足,可以根据上面的步骤修改资源限制配置。连接到 Airbyte 工作数据库并且执行以下 query(注意需要将 id-from-step-1 替换您上一步获取的,然后执行query。

2023-03-03 17:28:04 85

原创 配置 AIRBYTE 工作数据库

此外,使用云托管的Postgres实例(如AWS的RDS,GCP的Cloud SQL),您将得到更细粒度的备份和实例大小调整。#外部数据库的用户名 DATABASE_USER=postgres #外部数据库的密码 DATABASE_PASSWORD=password #外部数据库的 ip 或者域名 DATABASE_HOST=host.docker.internal #外部数据库的端口 DATABASE_PORT=3000 #外部数据库的 db 名称 DATABASE_DB=postgres。

2023-03-02 17:49:04 240

原创 Docker部署Airbyte

(可选操作)按需修改安装目录下的.env文件,这里可以修改登录用户(BASIC_AUTH_USERNAME)和密码(BASIC_AUTH_PASSWORD)拉取airbyte代码,打开powershell,进入你想安装airbyte的目录。vim .env#拉起服务(第一次拉起的时候,由于拉取的镜像比较多,会比较慢)安装airbyte,打开终端,进入你想安装airbyte的目录。#拉起服务(第一次拉起的时候,由于拉取的镜像比较多,会比较慢)部署完成,浏览器打开airbyte,访问地址为。

2023-02-28 17:53:55 224

原创 Airbyte API

Destination_definition:目标定义,实现了目标的增删改查功能。Source_definition:来源定义,实现了来源的增删改查功能。Workspace:工作区管理,实现了工作区的创建、删除等功能。Connection:管道管理,实现了管道的创建、删除等功能。Destination:目标管理,实现了来源连接建立等功能。Source:来源管理,实现了来源连接建立等功能。Oauth:权限管理,实现来源目标的授权管理。State:状态管理,获取和更新管道运行状态。Logs:日志管理。

2023-02-27 17:58:11 41

原创 Airbyte的同步复制模式

在某些复制模式下,这是必需的,用于确保对源系统中单个记录的多个更新将正确应用于目标系统中的单个记录。在增量复制的上下文中,可以将游标视为指向源数据集的指针,该指针用于跟踪从该源发送到目标的最新记录。在每次同步运行中,都会对源执行一个查询以选择要复制的记录,并且此查询被构造为包含游标,以便仅返回比游标更新(即以前未复制)的记录。对于 CDC 复制,不需要指定游标,因为事务日志中的时间戳和/或序列号(用作 CDC 复制的源)具有相同的用途。只有自上次同步运行以来在源系统中插入或更新的记录才会发送到目标。

2023-02-24 17:51:45 134

原创 Airbyte架构

Config API:Airbyte 的主控制平面。Airbyte 中的所有操作,例如创建源、目标、连接、管理配置等。从 API 配置和调用。Scheduler:调度程序从 API 获取工作请求,并将其发送到临时服务进行并行化。作为一款技术复杂的数据集成管道,Airbyte的架构模式非常清晰明了。UI:一个易于使用的图形界面,用于与Airbyte API进行交互。Scheduler Store:存储调度程序簿记的状态和作业信息。WebApp Server:处理 UI 和 API 之间的连接。

2023-02-23 18:02:10 71

原创 Airbyte入门

此外,使用云托管的 Postgres 实例(例如 AWS RDS 我们的 GCP 云 SQL),您将受益于自动备份和细粒度大小调整。您可以从一个非常小的实例开始,但根据您的 Airbyte 使用情况,如果不截断作业历史记录,作业数据库可能会增长并需要更多存储空间。系统将要求您输入用户名和密码,默认用户名和密码是 airbyte 和password,部署到服务器后,请务必在.env文件中更改默认用户和密码。请注意,源(或目标)连接器中的实际数据永远不会传输或保留在此内部数据库中。连接器可以用任何语言编写。

2023-02-22 17:46:23 406

原创 Airbyte支持的数据源类型

Airbyte能支持的常用软件非常多:如抖音、Wordpress、Salesforce、Metabase、Netsuite、Peoplesoft、SAP Business One、Shopify、Zoom、Docker hub、Github、GitLab、Jira、MeiliSearch等等。Airbyte支持的数据类型丰富,全部类型详见官网。与其它软件API集成。

2023-02-21 17:56:30 142

原创 Python技术栈专业大数据处理首选,中国自然资源航空物探遥感中心青睐达之云

日前,中国自然资源航空物探遥感中心和达之云签订合同,采用达之云产品应用于航空物探遥感大数据处理。达之云产品的最前沿Python技术栈,强大的自定义低代码功能、和极易上手的二次开发能力成为专业大数据处理的首选。国家队对达之云的认可也体现了Python技术栈在专业数据处理的领域的无可替代的优势。

2023-01-17 10:23:06 53

原创 喜讯:达之云承建的西安翻译学院大数据可视化项目顺利通过专家验收

驾驶舱主要以人事指标、教务指标、学工指标、资产指标、科研指标、学校荣誉、新生分布等数据分析展示;人事主题主要以教工分布、教工来源情况、教师管理学历分布、教师年龄、专业技术、专职兼职分布、学院部门、辅导员年龄性别学历等数据分析展示;科研主题主要以科研项目、科研项目经费、论文、著作、成果、专利、软著、团队、平台、会议等数据分析展示;该项目前期完成了对校办,人事处,科研处,资产处,教务处,学工处,图书馆,后勤,房管等部门沟调研通,确认以驾驶舱为主,以人事、科研、教务、资产、学工和数据治理门户做数据分析展示。

2022-12-16 19:03:13 192

原创 Metabase学习教程:权限-6

由于我们的公司已经在使用LDAP进行单点登录(SSO),所以我们想从LDAP中获取有关哪些人是(或不是)HR的信息。但是如果我们关闭那个窗口,打开另一个窗口,然后以Farrah的身份登录,我们。,我们可以填写在LDAP中标识组的可分辨名称(在本例中,是前面创建的Human Resources组的DN)。一旦LDAP有了正确的记录,我们就可以使用具有管理员权限的帐户登录到Metabase。相反,我们需要一个单独的。,我们可以看到图标,显示谁的帐户来自LDAP,而不是由Metabase管理。

2022-12-09 17:42:08 232

原创 Metabase学习教程:权限-5

Metabase可以知道的关于本机查询的是它所查询的数据库,因此我们必须单独检查每个查询。我们将单击Brown女士的名字,深入查看有关她在Metabase中的操作的详细信息(图6)。我们还可以使用审计日志来寻找机会,使我们的仪表板加载更快,或者通过确保人们使用他们可以信任的仪表板来帮助人们找到他们需要的数据。从最流行的仪表板图表。中,我们可以更深入地检查Orange博士的帐户,查看他们查看了哪些查询,撤销他们的访问权限。,将Orange博士能够访问的集合中的任何任性查询归档,并与他们谈论他们所查看的数据。

2022-12-08 17:37:49 87

原创 Metabase学习教程:权限-2

使用集合权限设置具有权限的集合,以帮助用户组织和共享与其相关的工作。集合保持问题,仪表板,和模型有条理,容易找到。将集合视为存储我们工作的文件夹是很有帮助的。集合权限授予一群人访问:查看或编辑保存在集合中的问题、仪表板或模型。编辑集合详细信息,例如集合的名称或保存位置。在本教程中,我们将为一家拥有名为Canoes和Sailboats的团队的公司创建集合,并设置收集权限,以便:公司中的每个人都可以查看但不能编辑保存在公司顶层集合中的工作(在Metabase中,它被称为我们的分析-您可以将其视为根目录或父文件夹

2022-12-07 17:52:13 311

原创 Metabase学习教程:权限-1

数据权限指南通过设置对Metabase包含的示例数据库的权限,了解Metabase如何处理数据权限。数据权限指定差异有多大一群人可以与表和数据库交互。在本文中,我们将介绍一个示例,说明如何授予用户从中查看、编辑或查询表的权限示例数据库.引入数据权限让我们从导航到行政>权限,然后选择数据库>示例数据库。这将转到数据库级别的“数据权限”页。如果要为每个数据表在Sample数据库中,可以单击左侧的表名。编辑 图1。在进行任何更改之前,请打开示例数据库的“数据权限”页。必须为组配置数据权限.Metabase附带两个

2022-12-06 18:01:48 537

原创 Metabase学习教程:系统管理-1

例如,使用Okta,可以登录到您的身份提供商一次,然后他们就可以使用他们可以访问的所有服务,而不必经常重新输入他们的登录名和密码或不同的登录名和密码。但是,由于可以在数据库级别设置SQL编辑器权限,因此可以创建两个(或更多)到同一数据库的连接,每个连接都为该数据库中的不同用户帐户使用不同的连接字符串。我们将停留在一个高层次上,并链接到关于各个特性的更详细的指南,我们的重点将放在Metabase的管理上,特别是组织中的人员。在您的组织中,数据自主化的目标是向人们提供他们需要的信息,以便他们做出更好的决策。

2022-12-02 17:35:07 268

原创 Metabase学习教程:模型-1

是的,数据工程师会更了解数据管道中的管道,但他们不一定知道特定团队面临的问题以及这些问题的各个部分应该如何定义(例如,什么才是活动用户?在真实的模型中,您可能会有更多的问题需要回答,这将需要更多的列来回答(例如客户的年龄、他们在网站上花了多长时间、从购物车中添加和删除的项目,或者您认为您的团队将要问问题的所有其他数据点)。(请注意,如果更改模型的基础查询,则需要更新每个列的元数据)。为了让非技术人员更容易地询问有关您的数据的问题,您可以做的最有价值的事情是将您的数据放入一个使提问更直观的形状。

2022-12-01 17:58:14 125

原创 Metabase学习教程:仪表盘-5

意思:即使我们要将这个问题添加到仪表盘,并向该仪表盘添加一个过滤器小部件,该过滤器也不会对我们的SQL查询产生任何影响,因为在我们的代码中没有指定的位置让小部件插入其值。让我们添加另一个过滤器。当两个字段过滤器变量都连接到仪表盘过滤器小部件时,当我们在小部件中选择一个值时,两个问题都会用过滤后的数据更新它们的图表。现在,我们讨论的是过滤数据,精明的读者可能已经意识到我们的SQL代码中没有filter语句。我们的日期过滤器小部件中的选项,用于选择2019年1月1日至2019年12月31日的订单。

2022-11-29 18:09:02 158

原创 Metabase学习教程:仪表盘-5

意思:即使我们要将这个问题添加到仪表盘,并向该仪表盘添加一个过滤器小部件,该过滤器也不会对我们的SQL查询产生任何影响,因为在我们的代码中没有指定的位置让小部件插入其值。让我们添加另一个过滤器。当两个字段过滤器变量都连接到仪表盘过滤器小部件时,当我们在小部件中选择一个值时,两个问题都会用过滤后的数据更新它们的图表。现在,我们讨论的是过滤数据,精明的读者可能已经意识到我们的SQL代码中没有filter语句。我们的日期过滤器小部件中的选项,用于选择2019年1月1日至2019年12月31日的订单。

2022-11-29 18:08:07 69

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除