
数据挖掘
文章平均质量分 91
deepdata_cn
极深数据,深耕数据行业。
展开
-
知识推理的发展历程
知识推理是从已有的知识出发,运用逻辑规则、推理算法等手段,推导出新的知识或结论的过程,在人工智能、知识图谱、数据挖掘等多个领域都有重要应用。知识推理的目的是获取新知识。通过对已掌握的知识进行分析、推导,发现隐藏在数据和知识中的新信息,扩展知识边界。例如,在医疗领域,根据患者的症状、检查结果以及已有的医学知识,推理出可能患有的疾病及潜在的并发症,从而为诊断和治疗提供更多依据。其次是验证知识的一致性和完整性。检查知识体系中是否存在矛盾或缺失的部分。原创 2025-02-09 07:45:00 · 695 阅读 · 0 评论 -
异构数据源同步工具(DataX)
DataX 是阿里巴巴集团推出的一款开源的异构数据源离线同步工具。致力于实现包括关系型数据库、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。原创 2024-08-30 07:45:00 · 1129 阅读 · 0 评论 -
分布式数据集成引擎(Bitsail)
Bitsail 是一个开源的分布式数据集成引擎。字节跳动于 2022 年 10 月 26 日正式在 GitHub 开源,为更多的企业和开发者带来便利,降低数据建设的成本,让数据高效地创造价值。BitSail支持20多种异构数据源间的数据同步,并提供离线、实时、全量、增量场景下的全域数据集成解决方案,目前服务于字节内部几乎所有业务线,包括抖音、今日头条等大家耳熟能详的应用,同时也支撑了火山引擎多个客户的数据集成需求。原创 2024-08-30 07:30:00 · 1502 阅读 · 0 评论 -
ETL工具(Kettle)
Kettle(也称为 Pentaho Data Integration)是一款功能强大的开源 ETL(Extract, Transform, Load)工具,主要用于数据仓库和商业智能领域。Kettle最早可追溯到本世纪初,当时ETL工具种类繁多。Kettle的作者Matt Casters在2001年有了开发自己的ETL工具的想法,他每天忙于咨询工作,为不同项目不断修改ETL代码和框架,部署各种ETL工具的代码生成器。原创 2024-08-29 07:45:00 · 1090 阅读 · 0 评论 -
数据集成引擎(Airbyte)
Airbyte 是一个开源的 ELT(Extract-Load-Transform)平台,帮助用户轻松地从各种数据源中提取数据,并将其加载到目标数据仓库或数据库中,同时支持在加载过程中进行一定程度的转换操作。创立于2020 年,Michel Tricot(曾是 Liveramp 和 Rideos 的前工程总监兼集成负责人)和 John Lafleur(专注于开发工具和 B2B 服务的连续创业者)共同创立了 Airbyte。最初他们想专注于营销公司的数据连接,后来转向数据整合赛道。原创 2024-08-29 07:30:00 · 1806 阅读 · 0 评论 -
数据挖掘工具(RapidMiner)
RapidMiner是一款功能强大的数据挖掘和机器学习工具,它提供了从数据预处理、建模、评估到部署的一系列流程。它最初由德国多特蒙德工业大学的人工智能部门开发,原名Yale,后更名为RapidMiner。RapidMiner以其图形用户界面(GUI)和拖拽式操作而闻名,这使得即使是初学者也能快速上手进行数据分析。原创 2024-08-27 07:45:00 · 1442 阅读 · 0 评论 -
数据挖掘工具(Weka)
Weka(Waikato Environment for Knowledge Analysis)是一款免费的、开源的机器学习和数据挖掘软件,主要用于解决实际的数据挖掘问题。Weka的开发始于20世纪90年代初,由新西兰怀卡托大学的Ian H. Witten和Eibe Frank等学者发起。Weka主要专注于数据挖掘算法的研究和实现,涵盖了分类、聚类、关联规则挖掘等基本的数据挖掘任务,逐渐在学术界获得认可。原创 2024-08-27 07:30:00 · 1645 阅读 · 0 评论