
数据
文章平均质量分 73
架构师研究会
有20多年IT工作经历,目前在一家500强做企业架构。因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【架构师研究会】和【开发者开聊】,有更多的内容分享。
展开
-
【开源软件】最好的开源软件-2023-第21名 Redpanda
Redpanda是主要用C++编写的Kafka的插件替代品,它使用Seastar异步框架和Raft共识算法作为分布式日志。它可以将平均延迟降低10倍,Kafka事务速度提高6倍,同时运行的资源更少。即使在C++中重新实现之外,Redpanda也使用异步、无共享、每个核心线程的模型,无锁定、最小上下文切换和线程本地内存访问。Redpanda通过内联WebAssembly转换和地理复制的分层存储/阴影索引,超越了Kafka协议,进入了流媒体的未来。原创 2023-12-13 21:40:11 · 595 阅读 · 0 评论 -
【开源软件】最好的开源软件-2023-第22名 Apache Iceberg
Apache Iceberg是一种用于大型分析表的高性能格式,它将SQL表的可靠性和简单性带到了大数据中,同时使Trino、Spark、Sonar、Presto、Hive、Flink和Impala等引擎能够同时安全地使用相同的表。Iceberg支持灵活的SQL命令来合并新数据、更新现有行和执行有针对性的删除。它可以急切地重写数据文件以获得读取性能,也可以使用删除增量以获得更快的更新。Iceberg支持模式进化、自动分区、时间旅行查询、版本回滚和开箱即用的数据压缩。原创 2023-12-13 21:37:45 · 567 阅读 · 0 评论 -
【开源软件】最好的开源软件-2023-第23名 Apache Druid
Apache Druid是一个实时分析数据库,通过Kafka、Kinesis和其他平台的流摄取,提供亚秒查询、高并发性以及实时和历史见解。原创 2023-12-13 20:36:47 · 433 阅读 · 0 评论 -
【预测工具】不须编码的预测和数据可视化工具
不须编码的预测和数据可视化工具原创 2023-12-03 13:57:01 · 1201 阅读 · 0 评论 -
「数据科学」数据科学家为什么应该学习PostgreSQL?
SQL是成为数据科学家的必要条件吗?答案是肯定的。数据科学已经发展了,虽然许多数据科学家仍然使用CSV文件(值以逗号分隔的文本文件),但它们不是最好的选择。Python Panda库允许从CSV文件加载数据,但是这些文件有许多约束。例如,它们通常不连接到数据库,这就要求您在每次更新数据时生成一个新的CSV文件提取。在大数据时代,这是完全不切实际的。关系数据库为使用大数据存储库提供所需的支持和敏捷性...原创 2023-02-17 21:24:27 · 416 阅读 · 0 评论 -
【数据分析】什么是数据分析? 分析和管理数据以做出决策
数据分析是一门专注于从数据中提取洞察力的学科,包括数据的分析、收集、组织和存储,以及用于执行此操作的工具和技术数据分析定义数据分析是一门专注于从数据中提取洞察力的学科。它包括数据分析和管理的过程、工具和技术,包括数据的收集、组织和存储。数据分析的主要目的是对数据应用统计分析和技术来发现趋势和解决问题。作为分析和塑造业务流程以及改进决策和业务成果的一种手段,数据分析在企业中变得越来越重要。数据分析从...原创 2022-10-15 21:29:18 · 1272 阅读 · 0 评论 -
【CDO观点】陶氏 CDO Chris Bruman:我们需要一种新的数据质量方法
通过将 IT 定位为业务部门是数据所有者的解决方案中心(Hub),陶氏的 IT 组织可以更快地响应以提供业务和客户价值。去年,陶氏在更好地利用其数据方面迈出了大胆的一步。为了消除孤立的数据孤岛并更好地利用商业智能作为企业资产,该公司成立了一个内部组织,将 IT 和公司的全球业务部门无缝集成到一个保护伞下。该组织的结构称为业务数据服务,类似于自行车车轮,以 IT 为中心,辐条延伸到陶氏的业务部门、地...原创 2022-10-11 21:33:45 · 172 阅读 · 0 评论 -
【数据科学家】什么是数据科学家? 一个关键的数据分析角色和一个利润丰厚的职业...
数据科学家的角色因行业而异,但有一些共同的技能、经验、教育和培训可以帮助你在数据科学职业生涯中占据一席之地。什么是数据科学家?数据科学家是分析数据专家,他们使用数据科学从大量结构化和非结构化数据中发现见解,以帮助塑造或满足特定的业务需求和目标。数据科学家在企业中变得越来越重要,因为组织越来越依赖数据分析来推动决策制定,并将自动化和机器学习作为其 IT 战略的核心组成部分。数据科学家职位描述数据科学...原创 2022-10-04 21:02:06 · 998 阅读 · 0 评论 -
【首席数据官】什么是首席数据官? 从数据中创造商业价值的领导者
首席数据官 (CDO) 负责监督一系列与数据相关的职能,以确保您的组织从最有价值的资产中获得最大收益。首席数据官 (CDO) 是负责整个组织内数据的利用和治理的高级管理人员。虽然首席数据官的头衔通常简称为 CDO,但不应将其与经常被称为 CDO 的首席数字官的角色混淆。咨询公司 Carruthers and Jackson 的董事 Caroline Carruthers 说:“首席数据官是负责业务...原创 2022-10-03 19:13:47 · 892 阅读 · 0 评论 -
【数据编织架构】数据编织架构是实现数据管理和集成现代化的关键
D&A 领导者应该了解数据编织架构的关键支柱,以实现机器支持的数据集成。在日益多样化、分布式和复杂的环境中,数据管理敏捷性已成为组织的任务关键优先事项。为了减少人为错误和总体成本,数据和分析 (D&A) 领导者需要超越传统的数据管理实践,转向现代解决方案,例如支持人工智能的数据集成“被称为“数据编织”的新兴设计概念可以成为应对一直存在的数据管理挑战的强大解...原创 2022-05-24 21:29:06 · 313 阅读 · 0 评论